Ml 


wm Aa MAF 学 从 F 


华章 教育 
P Pearson E 


ZI 3S 7r B 


Cia S jA 


[32] "bot - SHE - 维 斯 (Mark Allen Weiss) 4 


WFR 7 
GREASE 


Data Structures and Algorithm Analysis in C 


Second Edition 


tan b Data Structures 
m and 
w Algorithm Analysis in C 


POLAS 


Y | 





全) 机 械 工 业 出 版 社 





China Machine Press 








BH 454 3 TIE Ay C 语 言 描述 ( 厌 书 第 2 版 ) 典藏 版 


Data Structures and Algorithm Analysis in C Second Edition 


本 书 是 国外 数据 结构 与 算法 分 析 方面 的 经 典 教材 ， 原 书 曾 被 评 为 20 世 纪 项 尖 的 30 部 计算 机 著作 之 一 。 
作者 Mark Allen Weiss 在 数据 结构 和 算法 分 析 方面 卓 有 建 树 ， 他 的 数据 结构 和 算法 分 析 的 著作 尤其 畅销 ， 并 
受到 广泛 好 评 ， 已 被 世界 500 余 所 大 学 用 作 教 材 。 

在 本 书 中 ， 作 者 更 加 精练 并 强化 了 他 对 算法 和 数据 结构 方面 创新 的 处 理 方法 。 通 过 C 程 序 的 实现 ， 着 重 
阐述 了 抽象 数据 类 型 的 概念 ， 并 对 算法 的 效率 、 性 能 和 运行 时 间 进 行 了 分 析 。 


本 书 特点 
。 专用 一 章 来 讨论 算法 设计 的 技巧 ， 包 括 贪 楚 算 法 、 分 治 算法 、 动 态 规划 、 随 机 化 算法 以 及 回溯 算法 。 
o 介绍 了 当前 流行 的 论题 和 新 的 数据 结构 ， 如 斐 波 那 契 堆 、 斜 堆 、 二 项 队列 、 跳 跃 表 和 伸展 树 。 
。 安排 一 章 专门 讨论 摊 还 分 析 ， 考 察 书 中 介绍 的 一 些 高 级 数据 结构 。 
。 新 开辟 一 章 讨论 高 级 数据 结构 以 及 它们 的 实现 ， 包 括 红 黑 树 、 自 顶 向 下 伸展 树 、treap 树 、k 维 树 、 配 
对 堆 以 及 其 他 相关 内 容 。 
e 合并 了 堆 排 序 平均 情形 分 析 的 一 些 新 成 果 。 
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T.H E p wu B r 4 s H E RH "S w O R D SS 出 版 者 的 话 


文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 
的 各 个 领域 取得 了 垄断 性 的 优势 ;也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 
间 名 家 辈出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ,美国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 
计算 机 学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 
不 仅 壁 划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价 
值 并 不 会 因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 
日 益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ;而 专业 教材 的 建设 在 教育 
战略 上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美国 等 发 达 国 家 在 其 计算 
机 科学 发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 
建设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 就 将 
工作 重点 放 在 了 六 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ,我们 与 Pearson, 
McGraw- Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 和 良好 
的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 杜 选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brian W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey 
D. Ullman, Abraham  Silberschatz, William Stallings, Donald E. Knuth, John 
L. Hennessy, Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 
出 版 ， 供 读者 学 习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提 供 了 
中 肯 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ;而 原 书 的 作者 也 相当 关注 其 作 
品 在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 
yr 500 个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参 
考 书籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 
的 图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐 
渐 深 化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 和 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 
善 尽 美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢 迎 老 师 和 读者 
对 我 们 的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 . www. hzbook. com mu 
电子 邮件 : hzjsj@hzbook. com E 
联系 电话 : (010)88379604 T n 
联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 华章 教育 


邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 


随 着 速度 的 不 断 提高 和 存储 容量 的 持续 增长 ， 计 算 机 的 功能 日 益 强 大 ， 从 而 处 理 数据 
和 解决 问题 的 规模 和 复杂 程度 与 日 俱 增 。 这 不 仅 带 来 了 需要 认真 研究 的 新 课题 ， 而 且 突出 
了 原 有 数据 结构 和 算法 效率 低下 的 缺点 。 程 序 的 效率 问题 并 没有 由 于 计算 机 功能 的 强大 而 
受到 冷落 ， 相反， 被 人 们 提 到 前 所 未 有 的 重要 地 位 ， 因 为 大 型 问题 的 解决 所 涉及 的 大 容量 
存储 和 高 速度 运算 容 不 得 我 们 对 效率 有 丝毫 的 忽视 。 本 书 正 是 在 阐述 数据 结构 基本 概念 的 
同时 深入 地 分 析 了 算法 的 效率 。 书 中 详细 介绍 了 当前 流行 的 论题 和 新 的 变化 ， 讨 论 了 算法 
设计 技巧 ， 并 在 研究 算法 的 性 能 、 效 率 以 及 分 析 运 行 时 间 的 基础 上 考察 了 一 些 高 级 数据 结 
构 ， 从 历史 的 角度 和 近年 的 进展 对 数据 结构 的 活跃 领域 进行 了 简要 的 概括 。 由 于 本 书 原版 
选材 新 颖 ,方法 实用 ， 题 例 丰富 ， 取 舍得 当 ， 因 此 ， 自 出 版 以 来 受到 广泛 欢迎 , 已 被 世界 
许多 知名 大 学 用 作 教 材 。 

本 书 的 目的 是 培养 学 生 良 好 的 程序 设计 技巧 和 熟练 的 算法 分 析 能 力 ， 使 得 他 们 能 够 开 
发 出 高 效率 的 程序 。 从 服务 于 实践 和 锻炼 学 生 实际 能 力 出 发 ， 书 中 提供 了 大 部 分 算法 的 C 
语言 和 伪 代 码 例 程 ， 一 些 程序 可 从 互联 网 上 获得 。 

承蒙 卢 开 澄 教 授 、 温 莉 芳 女士 的 鼓励 ， 译 者 有 幸 将 国外 几 部 优秀 原著 介绍 给 我 国 的 读 
者 ， 在 此 表示 衷心 的 感谢 。 译 者 还 想 借 此 机 会 感谢 人 挚友 孙 华 先生 ， 他 对 本 书 的 翻译 工作 自 
始 至 终 给 予 热心 的 关怀 和 无 私 的 帮助 。 

由 于 时 间 及 水 平 所 限 ， 书 中 译文 不 当 之 处 ， 统 祈 学 术 界 同仁 及 广大 读者 赐 正 。 
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目的 


本 书 讨论 数据 结构 和 算法 分 析 。 数 据 结构 主要 研究 组 织 大 量 数据 的 方法 ， 而 算法 分 析 
则 是 对 算法 运行 时 间 的 评估 。 随 着 计算 机 的 速度 越 来 越 快 ， 对 于 能 够 处 理 大 量 输入 数据 的 
程序 的 需求 变 得 日 益 急 切 。 可 是 ， 由 于 在 输入 量 很 大 的 时 候 程序 的 低 效 率 现象 变 得 非常 明 
显 ， 因 此 这 又 要 求 对 效率 问题 给 予 更 仔细 的 关注 。 通 过 在 实际 编程 前 对 算法 进行 分 析 ， 学 
生 可 以 决定 一 个 特定 的 解法 是 否 可 行 。 例 如 ， 学 生 在 本 书 中 将 读 到 一 些 特定 的 问题 并 看 到 
精心 的 实现 方法 是 如 何 把 处 理 大 量 数 据 的 时 间 限 制 从 16 年 减 至 不 到 1 秒 的 。 因 此 ， 若 无 运 
行 时 间 的 前 释 ， 就 不 会 有 算法 和 数据 结构 的 提出 。 在 某 些 情况 下 ， 对 于 影响 算法 实现 的 运 
行 时 间 的 一 些微 小 细节 都 需要 认真 探究 。 

一 旦 确定 解法 ， 还 必须 编写 程序 。 随 着 计算 机 的 日 益 强 大 ,它们 必须 解决 的 问题 也 变 
得 更 加 巨大 和 复杂 ， 这 就 要 求 开发 更 加 复杂 的 程序 。 本 书 的 目的 是 教授 学 生 良 好 的 程序 设 
计 技 巧 和 提高 学 生 的 算法 分 析 能 力 ， 使 得 他 们 能 够 开发 出 具有 最 高 效率 的 程序 。 

本 书 适 合作 为 高 级 数据 结构 (CS7) 课 程 或 研究 生 第 一 年 算法 分 析 课 程 的 教材 。 学 生 应 该 
具有 中 等 程度 的 程序 设计 知识 ， 包 括 像 指针 和 递归 这 样 一 些 内 容 ， 还 应 该 具有 离散 数学 的 
某 些 知识 。 


方法 

我 相信 ， 对 于 学 生来 说 ， 重 要 的 是 学 习 如 何 自 己 动手 编写 程序 ， 而 不 是 从 书 上 拷贝 程 
序 。 但 另 一 方面 ， 讨 论 现实 程 序 设计 问题 而 不 套用 样本 程序 实际 上 是 不 可 能 的 。 由 于 这 个 
原因 ， 本 书 通常 提供 实现 方法 的 大 约 一 半 到 四 分 之 三 的 内 容 并 鼓励 学 生 补 足 其 余 的 部 分 。 
第 12 章 是 这 一 版 新 加 的 ， 讨 论 主要 侧重 于 实现 细节 的 一 些 附 加 的 数据 结构 。 


本 书 中 的 算法 均 以 ANSI C 表示 ， 尽 管 有 些 欠 缺 ， 但 它 仍然 是 最 流行 的 系统 程序 设计 
语言 。 使 用 C 代替 Pascal， 使 得 动态 分 配 数组 成 为 可 能 ( 见 第 5 章 中 的 “再 散 列 ”) 。 它 还 在 
几 处 地 方 将 代码 简化 ， 这 通常 是 与 (&&) 操 作 走 捷径 的 缘故 。 

对 C 的 大 多 数 批评 集中 在 用 它 写 出 的 程序 代码 可 读 性 差 的 事实 上 。 仅 仅 少 击 几 次 键 ， 
却 牺 牲 了 程序 的 清晰 性 ， 而 程序 的 速度 又 没有 增加 。 因 此 ， 诸 如 同时 赋值 以 及 通过 

if(x=y) 
测试 是 否 为 0 等 技巧 一 般 不 在 本 书 中 使 用 。 本 书 将 证 明 只 要 细心 练习 是 可 以 避免 那些 难以 
读 懂 的 代码 的 。 


内 容 提要 


第 1 草包 含 离散 数学 和 递归 的 一 些 复 习 材 料 。 我 相信 对 递归 做 到 泰然 处 之 的 唯一 办 法 
是 反复 不 断 地 看 一 些 好 的 用 法 。 因 此 ， 除 第 5 章 外 ， 递 归 遍 及 本 书 每 一 章 的 例子 之 中 。 

第 2 章 处 理 算 法 分 析 。 该 章 阐述 渐 近 分 析 和 它 的 主要 弱点 。 这 里 提供 了 许多 例子 ， 包 
括 对 对 数 运 行 时 间 的 深入 解释 。 通 过 直观 地 把 一 些 简单 递归 程序 转变 成 迭代 程序 而 对 它们 
进行 分 析 。 介 绍 了 更 为 复杂 的 分 治 程序 ， 不 过 有 些 分 析 ( 求 解 递 归 关 系 ) 要 推迟 到 第 7 章 再 
详细 讨论 。 

第 3 章 包 括 表 、 栈 和 队列 。 重 点 聚焦 于 使 用 ADT 对 这 些 数据 结构 编程 ， 这 些 数 据 结 构 
的 快速 实现 ， 以 及 介绍 它们 的 某 些 用 途 。 文 中 几乎 没有 什么 程序 (只 有 些 例 程 )， 而 程序 设 
计 作 业 的 许多 思想 基本 上 体现 在 练习 之 中 。 

第 4 章 讨论 树 ， 重 点 在 于 查找 树 ， 包 括 外 部 查找 树 (B BD. UNIX 文件 系统 和 表达 式 树 
是 作为 例子 来 介绍 的 。AVL 树 和 伸展 树 只 进行 了 介绍 而 没有 分 析 。 程 序 写 出 75%， 其 余部 
分 留 给 学 生 完 成 。 查 找 树 的 实现 细节 见 第 12 章 。 树 的 另外 一 些 内 容 ， 如 文件 压缩 和 博弈 
树 ， 延 迟到 第 10 章 讨 论 。 外 部 媒体 上 的 数据 结构 在 这 几 章 的 最 后 讨论 。 

第 5 章 是 相对 较 短 的 一 章 ， 主 要 讨论 散 列表 。 这 里 进行 了 某 些 分 析 ， 该 章 末 尾 讨论 了 
可 扩散 列 。 

第 6 曹 讨 论 优先 队列 。 二 叉 堆 也 在 该 章 讲 授 ， 还 有 些 附加 的 材料 论述 优先 队列 某 些 理 
论 上 有 趣 的 实现 方法 。 斐 波 那 契 堆 在 第 11 章 讨 论 ， 配 对 堆 在 第 12 章 讨 论 。 

第 7 章 讨论 排序 。 它 特别 关注 编程 细节 和 分 析 ， 讨 论 并 比较 所 有 通用 的 排序 算法 。 对 
以 下 四 种 算法 进行 了 详细 的 分 析 : 持 入 排序 、 希 尔 排 序 、 堆 排序 以 及 快速 排序 。 堆 排序 平 
均 情 形 运行 时 间 的 分 析 对 于 这 一 版 来 说 是 新 的 内 容 。 该 章 末尾 讨论 了 外 部 排序 。 

第 8 章 讨论 不 相交 集 算法 并 证 明 其 运行 时 间 。 该 章 短 而 专 ， 如 果 不 讨 论 Kruskal 算法 
则 可 跳 过 。 


第 9 章 讲授 网 论 算法 。 网 论 算法 很 重要 ， 不 仅 因 为 在 实践 中 经 常用 到 它们 ， 而 且 还 因 
为 它们 的 运行 时 间 强 烈 地 依赖 于 数据 结构 的 恰当 使 用 。 实 际 上 ， 所 有 标准 算法 都 是 和 相应 
的 数据 结构 、 伪 代码 以 及 运行 时 间 的 分 析 一 起 介绍 的 。 为 把 这 些 问 题 放 进 一 本 适当 的 教材 
中 ,我 们 对 复杂 性 理论 (包括 NP- 完 全 性 和 不 可 判定 性 ) 进 行 了 简短 的 讨论 。 

第 10 章 通 过 考察 一 般 的 问题 求解 技巧 讨论 算法 设计 。 该 章 添加 了 大 量 的 实例 。 这 里 及 
后 面 各 章 使 用 的 伪 代 码 使 得 学 生 能 更 好 地 理解 例子 ， 从 而 避免 被 实现 的 细节 干扰 。 

第 11 章 处 理 摊 还 分 析 。 对 来 自 第 4 章 到 第 6 章 的 三 种 数据 结构 以 及 该 章 介 绍 的 斐 波 那 
契 堆 进行 了 分 析 。 

第 12 章 是 这 一 版 新 加 的 ， 讨 论 查 找 树 算法 、& 维 (k-d) 树 和 配对 堆 。 不 同 于 其 他 各 章 ， 
该 章 给 出 了 查找 树 和 配对 堆 完 整 详细 的 实现 。 教 师 可 以 把 一 些 内 容纳 入 其 他 各 章 的 讨论 之 
中 。 例 如 ， 第 12 章 中 的 自 顶 向 下 红 黑 树 可 以 在 第 4 章 的 AVL 树 下 讨论 。 

第 1 章 到 第 9 章 为 大 多 数 的 一 学 期 数据 结构 课程 提供 了 足够 的 材料 。 如 果 时 间 允 许 ， 
那么 第 10 章 也 可 以 包括 进来 。 研 究 生 的 算法 分 析 课 程 可 以 使 用 第 7 章 到 第 11 章 的 内 容 。 
第 11 章 所 分 析 的 高 级 数据 结构 可 以 容易 地 在 前 面 各 章 中 查 到 。 第 9 章 中 对 NP- 完 全 性 的 讨 
论 对 于 这 门 课 来 说 太 过 简要 ，Garey 和 Johnson Wie NP- 完 全 性 的 书 可 以 补充 本 书 的 不 足 。 


练习 


po 


j 章 末尾 提供 的 练习 与 书 中 讲授 的 内 容 顺序 相 匹 配 。 最 后 的 一 些 练习 针对 整个 一 章 而 
不 是 特定 的 某 一 节 。 难 做 的 练习 以 一 个 星 号 标记 ， 更 难 的 练习 标 有 两 个 星 号 。 
教师 可 从 Addison-Wesley 出 版 公司 得 到 包含 几乎 所 有 练习 答案 的 解 题 指南 ”。 


参考 文献 


Y. 


参考 文献 位 于 每 章 的 最 后 。 一 般 说 来 ， 这 些 参考 文献 或 者 是 历史 性 的 ， 代 表 着 书 中 材料 
的 原始 来 源 ， 或 者 曾 述 对 书 中 给 出 的 结果 的 扩展 和 改进 。 有 些 文献 论述 了 一 些 练习 的 解法 。 


代码 的 获得 


本 书 中 的 程序 代码 可 通过 匿名 ftp Æ aw. com 网 站 得 到 。 这 个 网 站 也 可 以 通过 World 
Wide Web 来 访问 ， 其 URL X http://www. aw. com/cseng/( 从 此 处 继续 链接 )。 该 资料 的 
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数据 结构 与 算法 分 析 C 语言 描述 


在 这 一 章 , 我 们 阐述 本 书 的 目的 ， 并 简要 复习 离散 数学 以 及 程序 设计 的 一 些 概念 。 我 
们 将 : 
e 看 到 程序 在 较 大 输入 情况 下 的 运行 性 能 与 在 适量 输入 情况 下 的 运行 性 能 具有 同等 重 
要 性 。 
e 总 结 本 书 其 余部 分 所 需要 的 数学 基础 。 
e 简要 复习 递归 。 


1.1 本 书 讨论 的 内 容 


设 有 一 组 N 个 数 而 要 确定 其 中 第 & 个 最 大 者 。 我 们 称 之 为 选择 问题 (selection 
problem) 。 大 多 数学 习 过 一 两 门 程序 设计 课程 的 学 生 写 一 个 解决 这 种 问题 的 程序 不 会 有 什 
么 困难 。 “显而易见 的 ”解决 方法 有 很 多 。 

该 问题 的 一 种 解法 就 是 将 这 N 个 数 读 进 一 个 数组 中 ， 再 通过 某 种 简单 的 算法 ， 比 如 冒 
泡 排 序 法 ， 以 递减 顺序 将 数组 排序 ， 然 后 返回 位 置 k 上 的 元 素 。 

稍微 好 一 点 的 算法 可 以 先 把 前 & 个 元 素 读 入 数组 并 (以 递减 的 顺序 ) 对 其 排序 。 接 着 ， 
将 剩 下 的 元 素 再 逐个 读 和 人 。 当 读 取 新 元 素 时 ， 如 果 它 小 于 数组 中 的 第 个 元 素 则 忽略 ， 否 
则 就 将 其 放 到 数组 中 正确 的 位 置 上 ， 同 时 将 数组 中 的 一 个 元 素 挤 出 数组 。 当 算法 终止 时 ， 
位 于 第 & 个 位 置 上 的 元 素 作 为 答案 返回 。 

这 两 种 算法 的 编码 都 很 简单 ， 建 议 读 者 试 一 试 。 此 时 我 们 自然 要 问 : 哪个 算法 更 好 ? 
哪个 算法 更 重要 ? 还 是 两 个 算法 都 足够 好 ? 使 用 含有 100 万 个 元 素 的 随机 文件 ， 在 k= 
500 000 的 条 件 下 进行 模拟 发 现 ， 两 个 算法 在 合理 的 时 间 内 均 不 能 结束 ， 每 种 算法 都 需要 计 
算 机 处 理 若 干 天 才能 算 完 (虽然 最 后 还 是 给 出 了 正确 的 答案 )。 在 第 7 章 将 讨论 另 一 种 算法 ， 
该 算法 将 在 1 秒 左 右 给 出 问题 的 解 。 因 此 ， 虽 然 我 们 提出 的 两 个 算法 都 能 算出 结果 ， 但 是 
不 能 认为 它们 是 好 的 算法 ， 因 为 对 于 第 三 种 算法 在 合理 的 时 间 内 能 够 处 理 的 输入 数据 量 而 
言 ， 这 两 种 算法 是 完全 不 切实 际 的 。 

第 二 个 问题 是 解决 一 个 流行 的 字谜 。 输 入 由 一 些 含 字母 的 二 站 























维 数 组 和 一 个 单 记 列 表 组 成 。 目 标 是 要 找 出 字迹 中 的 单词 ， 这 些 | 一 | 一 一 
单词 可 能 是 水 平 、 重 直 或 沿 对 角 线 以 任何 方向 放置 的 。 作 为 例 | 2 | w a 1: ] 
T. 图 1-1 BOR MU FREI AUR] this, two, fat 和 that 组 成 。 单 词 | 4| e a t 
this 从 第 一 行 第 一 列 的 位 置 即 (1，1) 处 开始 并 延伸 至 (1，4);， 单 

图 1-1 FRR 


词 two 从 (1，1) 到 (3，1);，fat 从 (4，1) 到 (2，3);， 而 that WM 
(4，4) 到 (1，1)。 

现在 至 少 有 两 种 直观 的 算法 来 求解 这 个 问题 。 MEET E 
个 有 序 三 元 组 (行列 ,方向 )， 验 证 是 否 有 单词 存在 。 这 需要 大 量 嵌 套 的 for 循环 ， 但 它 
基本 上 是 直观 的 算法 。 

或 者 ， 对 于 每 一 个 尚未 进行 到 字谜 最 后 的 有 序 四 元 组 ( 行 ， 列 ， 方 向 ， 字 符 数 ) 我 们 可 
以 测试 所 指 的 单词 是 否 在 单词 表 中 。 这 也 导致 使 用 大 量 骨 套 的 for 循环 。 如 果 在 任意 单词 


中 的 最 大 字符 数 已 知 ， 那 么 该 算法 有 可 能 节省 一 些 时 间 。 

上 述 两 种 方法 相对 来 说 都 不 难 编 码 ， 并 可 求解 通常 发 表 于 杂志 上 的 许多 现实 的 字谜 游 
戏 。 这 些 字迹 通常 有 16 行 16 列 以 及 40 个 左右 的 单词 。 然 而 ,假设 我 们 把 字谜 变 为 只 给 出 
ik HR (puzzle board) 而 单词 表 基 本 上 是 一 本 英语 词典 ， 则 上 面 提出 的 两 种 解法 需要 相当 可 观 
的 时 间 来 解决 这 个 问题 ， 故 这 两 种 方法 都 是 不 可 接受 的 。 不 过 ， 这 样 的 问题 还 是 有 可 能 在 
数秒 内 解决 的 ， 即 使 单词 表 很 大 也 可 以 。 

在 许多 问题 当中 ， 一 个 重要 的 观念 是 : 写 出 一 个 可 以 工作 的 程序 并 不 够 。 如 果 这 个 程 
序 在 巨大 的 数据 集 上 运行 ,那么 运行 时 间 就 变 成 了 重要 的 问题 。 我 们 将 在 本 书 中 看 到 对 于 
大 量 的 输入 如 何 估计 程序 的 运行 时 间 ,， 尤其 是 如 何在 尚未 具体 编码 的 情况 下 比较 两 个 程序 
的 运行 时 间 。 我 们 还 将 看 到 彻底 改进 程序 速度 以 及 确定 程序 瓶颈 的 方法 。 这 些 方法 将 使 我 
们 能 够 找到 需要 大 力 优化 的 那些 代码 段 。 


1.2 数学 知识 复习 


本 节 列 出 一 些 需要 记 住 或 是 能 够 推导 出 的 基本 公式 ， 复 习 基 本 的 证 明 方 法 。 


1.2.1 指数 
X4XB 一 xXars 
= X^ B 
(X4)! = RS 
X -- x8 gx" ue ih 
2N 4. gN — FNF 
1.2.2 对 数 


在 计算 机 科学 中 ， 除 非 有 特别 的 声明 ， 所 有 的 对 数 都 是 以 2 为 底 的 。 
EX: 当 且 仅 当 logy B—A, X^—B, 

由 该 定义 可 以 得 到 几 个 方便 的 等 式 。 

定理 1.1 


logc B : 
logc A’ 


WEH: 4 X=log- B, Y=log- A, WR Z=log, B。 此 时 由 对 数 的 定义 得 : C* =B, 
CY=A 以 及 A*==B。 联 合 这 三 个 等 式 则 产生 (CY)*= 二 C* 二 B。 因 此 ，X==YZ ， 这 意味 着 Z= 
X/Y., MIFE. 

定理 1.2 





log, B= C>0 


log AB=log A+log B 
证 明 : 4 X=log A, Y=log B. WAR Z=log AB。 此 时 由 于 假设 默认 的 底 为 2，2* = 
A, 2°=B 及 2? —AB, 联合 最 后 的 三 个 等 式 则 有 2*2* —2^ — AB, Bit, X+Y=Z, XE 
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明了 该 定理 。 
EA 其 他 一 些 有 用 的 公式 如 下 ， 它 们 都 能 够 用 类 似 的 方法 推导 。 
log A/B=log A—log B 
logCA^) — B log A 
log X X OX Bri B X20 成 立 ) 
log 1—0, log 2=1, log 1024—10, log 1 048 576— 20 


12.3 RAR 
最 容易 记忆 的 公式 是 


在 第 二 个 公式 中 ， 如 果 0 二 A<=1， 则 
XA < 
当 N 趋 于 ce 时 该 和 趋向 于 1/01 — A), ， 这 些 公 Enn eee eX. 
可 以 用 下 面 的 方法 推导 关于 SAW <A< D 的 公式 。 令 S 表示 和 ， 此 时 


S 二 1 十 A 十 A 十 A 十 A' 十 A 十 … 

于 是 
AS =A+A?+A°+A'+A5 ++ 
如 果 将 这 两 个 等 式 相 减 ( 这 种 运算 只 能 对 收敛 级 数 进行 )， 等 号 右边 所 有 的 项 相 消 ， 
Fl: 
S—AS =1 
这 就 是 说 
1 


a ar 


可 以 用 相同 的 方法 计算 Nus ， 它 是 一 个 经 常 出 现 的 和 。 我 们 写成 





— 5 eee 
S I: +A++ 
用 2 乘 之 得 到 
[4] NW I EO TS TM 
ot ee ee er ee ee i 
将 这 两 个 方程 相 减 得 到 





Sf tgs dba pu 
imita xd Ru NS mE E 


Auk, S—2. 

分 析 中 男 一 种 常用 类 型 的 级 数 是 算术 级 数 。 任 何 这 样 的 级 数 都 可 以 通过 基本 公式 计算 其 值 。 

yi E END d x 

例如 ， 为 求 出 和 2+H5+8+ +31), KEKSA 302-2434 5 —O414- 
1 十 … 十 1)， 显 然 ， 它 就 是 3k(k 十 1)/2 一 k。 男 一 种 记忆 的 方法 则 是 将 第 一 项 与 最 后 一 项 相 
加 (和 为 3k 十 1)， 第 二 项 与 倒数 第 二 项 相 加 (和 也 是 3k 十 1)， 等 等 。 由 于 有 /2 个 这 样 的 数 
对 ， 因 此 总 和 就 是 &(34 十 1)/2， 这 与 前 面 的 答 iila 

现在 介绍 下 面 两 个 公式 ， 它 们 就 没有 那么 常 


St N(N+1)(2N+1) N? 
全 | 6 = 








2) TYTTT PT É Rx 

当 & 一 一 1 时 ， 后 一 个 公式 不 成 立 。 此 时 我 们 需要 下 面 的 公式 ， 这 个 公式 在 计算 机 科学 
中 的 使 用 要 远 比 在 其 他 数学 科目 中 的 使 用 多 。 数 Ay 叫 作 调和 数 ， 其 和 叫 作 调和 和 。 下 面 
近似 式 中 的 误差 趋向 于 y**0.577 215 66， 这 个 值 称 为 欧 拉 常 数 (Euler's constant), 


Hy = ») X ae tee 8 
=! 


1 


以 下 两 个 公式 只 不 过 是 一 般 的 代数 运算 。 


SN) = Nf CN) 
i=l 


woe Mio M fo 
12.4 H8 


如 果 NSE A 一 B， 那 么 我 们 就 说 A 5 BE N 同 余 (congruent)， 记 为 A=B(mod ND, 
直观 地 看 ， 这 意味 着 无 论 A 还 是 已 除 以 N， 所 得 余数 都 是 相同 的 。 于 是 ，81 三 61 三 
1(mod 10) 。 如 同等 号 的 情形 一 样 ， 若 A-B(mod N), M A+ C=B+C (mod ND EJ X AD= 
BD(mod N). 

有 许多 定理 适用 于 模 运算 ， 其 中 有 一 些 特 别 要 用 到 数论 来 证 明 。 我 们 将 谨慎 地 使 用 模 
运算 ， 这样， 前 面 的 一 些 定理 也 就 是 够 了 。 


1.2.5 证明 方法 
证 明 数 据 结构 分 析 中 的 结论 的 两 个 最 常用 的 方法 是 归纳 法 和 反 证 法 (偶尔 也 被 迫 用 到 只 
有 教授 们 才 使 用 的 证 明 方法 )。 证 明 一 个 定理 不 成 立 的 最 好 方法 是 举 出 一 个 反例 。 
归纳 法 证 明 
由 归纳 法 进行 的 证 明 有 两 个 标准 的 部 分 。 iod east ien case)， 就 是 确 
定 定理 对 于 某 个 ( 某 些 ) 小 的 (通常 是 退化 的 ) 值 的 正确 性 ， 这 一 步 几 乎 总 是 很 简单 的 。 接 着 ， 


[5] 
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进行 归纳 假设 (inductive hypothesis)。 一 般 说 来 ,这 意味 着 假设 定理 对 直到 某 个 有 限 数 k 的 
所 有 情况 都 是 成 立 的 。 然 后 使 用 这 个 假设 证 明定 理 对 下 一 个 值 (通常 是 十 1) 也 是 成 立 的 。 
至 此 定理 得 证 (在 有限 的 情形 下 )。 
作为 一 个 例子 ， 我 们 证 明 斐 波 那 契 数 F,—1. F,—1. F,=2, F,—3. F,—5, 
F,=F,-,+F,-2, XpiliWiÉF 0/3). (Ae MME FF 二 0， 这 只 不 过 将 该 级 数 做 了 
一 次 平移 。) 为 了 证 明 这 个 不 等 式 ， 我 们 首先 验证 定理 对 基准 情形 成 立 。 容 易 验 证 Fy = 1< 
5/3 及 F; 二 2 二 25/9， 这 就 证 明了 基准 情形 。 假 设 定 理 对 于 i 二 1，2，…, k RE, ARE 
归纳 假设 。 为 了 证 明定 理 ， 我们 需要 证 明 F,, 1, 二 (5/3)*!。 根 据 定义 我 们 有 
Fo, = Fe HFa 
将 归纳 假设 用 于 等 号 右边 ， 我 们 得 到 
Fi « (5/8)* + (5/3)! « (3/5) 5/3) + (3/5) (5/3)*! 
« (3/5) (5/3)* + (9/25) (5/3)*"! 


Fun (3/5 + 9/25) (5/3)**! < (24/25) 5/3)! < (5/3)"" 
这 就 证 明了 这 个 定理 。 
在 第 二 个 例子 中 ， 我 们 证 明 下 面 的 定理 。 


定理 1.3 如 果 N 之 1， 则 ye = SALES 


证 明 : 用 数学 归纳 法 证 明 。 对 于 基准 情形 ， 容 易 看 到 ， 当 N=1 的 时 候 定理 成 立 。 对 
于 归纳 假设 ， 我 们 设 定理 对 LRN 成立。 我 们 将 在 该 假设 下 证 明定 理 对 于 N 十 1 也 是 成 
立 的 。 我 们 有 





N+1 


N 
Le = ye TON D 
fe 


i=l 


应 用 归纳 假设 ,我 们 得 到 


N+1 











sec NON EIEN EIT cg Lise 
i=] 
= NSD 4e 04-13 | 
pen a SEINE. (WE DEN e+ 
= (N+1) : : 
因此 
3E _ (N+ DON + D-- TION 19 +- 1) 
6 
i=l 
定理 得 证 。 
通过 反例 证 明 
公式 FEE 不 成 立 。 证 明 这 个 结论 最 容易 的 方法 就 是 计算 Fai =144>11°, 
反 证 法 证 明 


反 证 法 证 明 是 通过 假设 定理 不 成 立 ， 然 后 证 明 该 假设 导致 某 个 已 知 的 性 质 不 成 立 ， 从 


而 说 明 原 假设 是 错误 的 。 一 个 经 典 的 例子 是 证 明 存在 无 穷 多 个 素数 。 为 了 证 明 这 个 结论 ， 
我 们 假设 定理 不 成 立 。 于 是 ， 存 在 某 个 最 大 的 素数 Pi。 令 Pi, Pos ey, Py 是 依 序 排列 的 
所 有 素数 并 考虑 

N = P,P;P,:P,41 
显然 ，N 是 比 P 大 的 数 ， 根 据 假设 N 不 是 素数 。 可 是 ，P ，P, ，…，P, 都 不 能 整除 N， 
因为 除 得 的 结果 总 有 余数 1。 这 就 产生 一 个 矛盾 ， 因 为 每 一 个 整数 或 者 是 素数 ， 或 者 是 素数 
的 乘积 。 因 此 ，P; 是 最 大 素数 的 原 假 设 是 不 成 立 的 ， 这 正 意 味 着 定理 成 立 。 


1.3 递归 简 论 


我 们 熟悉 的 大 多 数 数学 函数 是 由 一 个 简单 公式 描述 的 。 例 如 ， 我 们 可 以 利用 公式 
C = 5CF — 32)/9 
把 华氏 温度 转换 成 摄氏 温度 。 有 了 这 个 公式 ， 写 一 个 C 函数 就 太 简单 了 。 除 去 程序 中 的 说 
明和 大 括号 外 ， 将 一 行 公式 翻译 成 一 行 C 程序 。 
有 时 候 数 学 函数 以 不 太 标准 的 形式 来 定义 。 作 为 一 个 例子 ， 我 们 可 以 在 非 负 整数 集 上 
定义 一 个 函数 下 ， 它 满足 F(C0) 王 0 有 上 且 FOX) 王 2FCX 一 1) 十 X: 。 从 这 个 定义 我 们 看 到 FOOD 
l, F(22 —6, FG) —21. EUR F(4) 二 58。 当 一 个 函数 用 它 自己 来 定义 时 就 称 为 是 递归 的 














(recursive) , C FU PRICE S UI. OE E E RE E. «CHE Em (ULT 399 48 US E AE p 

一 种 企图 。 不 是 所 有 的 数学 递归 函数 都 能 

有 效 地 (或 正确 地 ) 由 C 的 递归 模拟 来 实 FC int X ) 

现 。 上 面 例 子 说 的 是 递归 函数 玉 应 该 只 用 | mi/ SfOX 0) 

几 行 就 能 表示 出 来 ， 正 如 非 递归 函数 一 ggg MO 

样 。 图 1-2 给 出 了 函数 下 的 递归 实现 。 dic Er return 2 * F(X- 1) eX * X 
第 一 行 和 第 二 行 处 理 基 准 情形 ， 即 此 

时 函数 的 值 可 以 直接 算出 而 不 用 求助 递 图 1-2 一 个 递归 函数 


归 。 正 如 若 没 有 “Ff(0)==0” 这 个 条 件 “F(X)==2F(X 一 1) 十 X:*” 在 数学 上 没有 意义 一 样 ， 
C 的 递归 函数 阁 无 基准 情形 ， 也 是 毫 无 意义 的 。 第 三 行 执行 的 是 递归 调用 。 

关于 递归 ， 有 几 个 重要 并 且 可 能 会 被 搞 混 的 地 方 。 一 个 常见 的 问题 是 : 它 是 否 就 是 循 
WZ $ (circular logic)? 答案 是 : 虽然 我 们 定义 一 个 函数 用 的 是 这 个 函数 本 身 ， 但 是 我 们 并 
没有 用 函数 本 身 定 义 该 函数 的 一 个 特定 的 实例 。 换 名 话说 ， 通 过 使 用 F(5) 来 得 到 下 (5) 的 值 
才 是 循环 的 。 通 过 使 用 下 (4) 得 到 F(5) 的 值 不 是 循环 的 ， 除 非 (4) 的 求 值 又 要 用 到 对 F(5) 
的 计算 。 两 个 最 重要 的 问题 恕 怕 就 是 “如 何 ” 和 “为 什么 ”的 问题 了 。 这 将 在 第 3 章 正 式 
解决 。 这 里 ,我 们 将 给 出 一 个 不 完全 的 描述 。 

实际 上 ， 递归 调 用 在 处 理 上 与 其 他 的 调用 没有 什么 不 同 。 如 果 以 参数 4 的 值 调 用 函数 
F， 那 么 程序 的 第 三 行 要 求 计算 2F(3) 十 4 *4。 这 样 ， 就 要 执行 一 个 计算 F(3) 的 调用 ， 而 





加 ”对 于 数值 计算 使 用 递归 通常 不 是 个 好 主意 。 我 们 只 在 解释 基本 论点 时 这 么 做 。 
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这 又 导致 计算 2F(2) 十 3x*3。 因 此 ， 又 要 执行 另 一 个 计算 F(2) 的 调用 ， 而 这 意味 着 必须 求 
出 2F(1) 十 2x*2 的 值 。 为 此 ， 通 过 计算 2F(0) 十 1 x* 1 而 得 到 (1)。 此 时 ，F(0) 必 须 被 赋 
值 。 由 于 这 属于 基准 情形 ， 因 此 我 们 事先 知道 (0) 二 0。 从 而 F011) 的 计算 得 以 完成 ， 其 结 
果 为 1。 然 后 ，F(2)、F(3) 以 及 最 后 (4) 的 值 都 能 够 计算 出 来 。 跟 踊 挂 起 的 函数 调用 (这 
些 调用 已 经 开始 但 是 正 等 待 着 递归 调用 来 完成 ) 以 及 它们 中 变量 的 记录 工作 都 是 由 计算 机 自 
动 完 成 的 。 然 而 ， 重 要 的 问题 在 于 ， 递 归 调 用 将 反复 进行 直到 基准 情形 出 现 。 例 如 ， 计 算 
下 (一 1) 的 值 将 导致 调用 下 (一 2)、 





int 


下 (一 3) 等 等 。 由 于 这 将 不 可 能 出 现 基 Bad( unsigned int N ) 
准 情形 ， 内 此 程序 也 就 不 可 能 算出 答 | ay E 
JR 12*/ return 0; 


案 。 偶 尔 还 可 能 发 生 更 加 微妙 的 错 else 
iR. 我 们 将 其 展示 在 图 13 中 。 7* 397 return Bad( N/ 31) « N- 1; 
图 1-3 中 程序 的 错误 是 将 第 三 行 上 的 
Bad(1)% X. Bad(1). MR. XR 图 1-3 无 终止 递归 程序 
上 Bad (1) 究 况 是 多 少 ， Reena ts 因此 ， 计 算 机 将 会 反复 调用 Baa (1) 以 
期 解 出 它 的 值 。 最 后 ， 计 算 机 短 记 系统 将 占 满 空间 ， 程 序 骨 溃 。 一 般 说 来 ,我 们 会 说 该 函 
数 对 一 个 特殊 情形 无 效 ， 而 在 其 他 情形 下 是 正确 的 。 但 此 处 这 么 说 则 不 正确 ， 因 为 Bad(2) 
调用 Bad (1)。 因 此 ，Bad (2) 也 不 能 求 出 值 来 。 不 仅 如 此 ，Bad (3)、Bad (4) 和 Bad (5) 都 
ponte ). Bad (2) 的 值 算 不 出 来 ， 它 们 的 值 也 就 不 能 求 出 。 事 实 上 ， 除 了 0 之 外 ， 

个 程序 对 任何 的 N 都 不 能 一 步 算出 结果 。 对 于 递归 了 苑 数 ， 不 存在 像 “特殊 情形 ”这 样 的 
si 

上 面 的 讨论 导致 递归 的 前 两 个 基本 法 则 : 

l. 基准 情形 (base case)。 必 须 有 某 些 基准 的 情形 ， 它 们 不 用 递归 就 能 求解 。 

2. 不 断 推 进 (making progress) 。 对 于 那些 需要 递归 求解 的 情形 ， 递 归 调 用 必须 能 够 朝 
着 产生 基准 情形 的 方向 推进 。 

在 本 书 中 我 们 将 用 递归 解决 一 些 问题 。 作 为 非 数 学 应 用 的 一 个 例子 ， 考 虑 一 本 大 词典 。 
间 典 中 的 词 都 是 用 其 他 的 词 定 义 的 。 当 我 们 查 一 个 单词 的 时 候 ， 我 们 不 理解 对 该 词 的 解释 ， 
于 是 不 得 不 再 查 出 现在 解释 中 的 一 些 词 。 而 对 这 tn ne 因此 
还 要 继续 这 种 搜索 。 因 为 词典 是 有 限 的 ， 所 以 实际 上 ， 要 么 我 们 最 终 查 到 一 处 ， 明 白 此 处 
ee es ee M. 
我 们 发 现 这 些 解 释 形成 一 个 循环 ， 无 法 明白 其 中 的 意思 ， 或 者 在 解释 中 需要 我 们 理解 的 某 
个 单词 不 在 这 本 词典 里 。 

理解 这 些 单词 的 递归 策略 如 下 : 如 果 我 们 知道 一 个 单词 的 含义 ， 那么 就 算 我 们 成 功 ; 
否则 ,我 们 就 在 词典 里 查找 这 个 单词 。 如 果 我 们 理解 该 词 解释 中 的 所 有 单词 ， 那 么 又 算 我 
们 成 功 ; 否则 ,递归 地 查找 一 些 我 们 不 认识 的 单词 来 “算出 ”对 该 单词 解释 的 含义 。 如 果 
1s] Ht Ag BET SE ECHR. 那么 这 个 过 程 就 能 够 终止 ; 如 果 其 中 一 个 单词 没有 查 到 或 是 形成 循 
环 定义 (解释 )， 那么 这 个 过 程 则 循环 不 定 。 











打印 输出 数 

设 我 们 有 一 个 正 整数 N 并 希望 把 它 打印 出 来 。 我 们 的 例 程 的 名 字 为 Printout(CN)。 
假设 仅 有 的 现成 WO 例 程 将 只 处 理 单个 数字 并 将 其 输出 到 终端 。 我 们 将 这 个 例 程 命名 为 
PrintDigit， 例 如，PrintDigit (4) 将 输出 一 个 “4” 到 终端 。 

递归 对 该 问题 提供 了 一 个 非常 简洁 的 解 。 为 打印 “76234”， 需 要 首先 打印 出 “7623”， 
然后 再 打印 出 “4”。 第 二 步 用 语句 PrintDigit (N%10) 很 容易 完成 , 但 是 第 一 步 却 不 比 原 
问题 简单 多 少 。 它 们 实际 上 是 同一 个 问题 ， 因 此 我 们 可 以 用 语句 Printout (N/10) 递 归 地 
解决 它 。 

这 告诉 我 们 如 何 去 解 决 一 般 的 问题 ， 不 过 我 们 仍然 需要 确认 程序 不 是 循环 不 定 的 。 由 
于 我 们 尚未 定义 一 个 基准 情形 ， 因 此 很 显然 ， 我 们 仍然 还 有 些 事情 要 人 做。 如果 OS N<10, 
那么 我 们 的 基准 情形 就 是 PrintDigit(N). WE, Printout (N) 已 对 每 一 个 从 0 到 9 的 
正 整数 做 出 定义 ， 而 更 大 的 正 整数 则 通过 较 小 的 正 整 数 定义 。 因 此 , 不 存在 循环 定义 。 整 
个 过 程 1-4 所 示 。 





void 
PrintOut( unsigned int N ) /* Print nonnegative N */ 


ifC N >= 10 ) 
PrintOut( N / 10 ); 
PrintDigit( N % 10 ); 
} 











图 1-4 打印 整数 的 递归 例 程 


我 们 没有 努力 去 高 效 地 编写 这 个 程序 。 我 们 本 可 以 避免 使 用 mod 操作 ( 它 的 耗费 是 很 大 
的 )， 因 为 N%10O=N-LN/10]*10,° 


递归 和 归纳 

我 们 将 使 用 归纳 法 对 上 述 数字 递归 打印 程序 给 予 更 严格 的 证 明 。 

定理 1.4 对 于 N 三 0， 数 字 递 归 打 印 算法 是 正确 的 。 

证 明 (根据 N 所 含 数字 的 位 数 ， 利 用 归纳 法 证 明 ): 

首先 ， 如 果 N 只 有 一 位 数字 ， 那 么 程序 显然 是 正确 的 ， 因 为 它 只 调用 一 次 PrintDig- 
it. Ma. W Printout 对 所 有 位 或 位 数 更 少 的 数 均 能 正常 工作 。k 十 1 位 的 数字 可 以 通 
过 其 前 & 位 数字 后 跟 一 位 最 低位 数字 来 表示 。 前 & 位 数字 形成 的 数 恰 好 是 LN/10 4， 归 纳 假 
设 它 能 够 被 正确 地 打印 出 来 ， 而 最 后 一 位 数字 是 N mod 10， 因 此 该 程序 能 够 正确 打印 出 任 
意 k 十 1 位 数 。 于 是 ， 根 据 归 纳 法 ， 所 有 的 数 都 能 被 正确 地 打印 出 来 。 

这 个 证 明 看 起 来 可 能 有 些 奇怪 实际 上 相当 于 算法 的 描述 。 它 阐述 的 是 在 设计 递归 程 
Hp. 同一 问题 的 所 有 和 较 小 实例 均 可 以 假设 运行 正确 ， 北 归程 序 只 需要 把 这 些 较 小 问题 的 
解 ( 它 们 通过 递归 奇迹 般 地 得 到 ) 结 合 起 来 而 形成 现行 问题 的 解 。 其 数学 根据 则 是 归纳 法 。 











日” 过 程 (procedure) 即 返回 值 为 voig 型 的 函数 。 
OQ LXJ] 意 为 小 于 或 等 于 X 的 最 大 整数 。 
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我 们 给 出 递归 的 第 三 个 法 则 : 

3. 设计 法 则 (design rule)。 假 设 所 有 的 递归 调用 都 能 运行 。 这 是 一 条 重要 的 法 则 ， 因 
为 它 意 味 着 ， 当 设计 递归 程序 时 一 般 没 有 必要 知道 短 记 管理 的 细节 ， 不必 试图 追踪 大 量 的 
递归 调用 。 追 踪 实 际 的 递归 调用 序列 常常 是 非常 困难 的 。 当 然 ， 在 许多 情况 下 ,这 正体 现 
了 使 用 递归 的 好 处 ， 因 为 计算 机 能 够 算出 复杂 的 细节 。 

递归 的 主要 问题 是 隐 含 的 短 记 开销 。 虽 然 这 些 开 销 几 乎 总 是 合理 的 (因为 递归 程序 不 仅 
简化 了 算法 设计 ， 而 且 也 有 助 于 给 出 更 加 简洁 的 代码 )， 但 是 递归 绝 不 应 该 作为 简单 for f 
环 的 代替 物 。 我 们 将 在 3. 3 节 更 仔细 地 讨论 递归 涉及 的 系统 开销 。 

当 编 写 递 归 例 程 的 时 候 ， 关 键 是 要 牢记 递归 的 四 条 基本 法 则 : 

l. 基准 情形 。 必 须 有 某 些 基准 的 情形 ， 它 们 不 用 递归 就 能 求解 。 

2. 不 断 推进 。 对 于 那些 需要 递归 求解 的 情形 ,递归 调用 必须 能 够 朝 着 产生 基准 情形 的 
方向 推进 。 

3. 设计 法 则 。 假 设 所 有 的 递归 调用 都 能 运行 。 

4. 合成 效益 法 则 (compound interest rule)。 在 求解 一 个 问题 的 同一 实例 时 ， 切 勿 在 不 
同 的 递归 调用 中 做 重复 性 的 工作 。 

第 四 条 法 则 的 正确 性 将 在 后 面 的 章节 给 予 证 明 。 使 用 递归 来 计算 诸如 斐 波 那 契 数 之 类 
简单 数学 函数 的 值 的 想法 一 般 来 说 不 是 一 个 好 主意 ， 其 根据 正 是 第 四 条 法 则 。 只 要 在 头脑 
中 记 住 这 些 法 则 ， 递 归程 序 设计 就 应 该 是 简单 明了 的 。 i 


和 总 结 


这 一 章 为 本 书 其 余部 分 商定 了 基础 。 对 于 面临 大 量 输入 的 算法 ， 它 所 花费 的 时 间 是 判 
别 其 好 坏 的 重要 标准 。( 当 然 正确 性 是 最 重要 的 。) 速 度 是 相对 的 。 对 于 一 个 问题 在 一 台 机 器 
上 是 快速 的 算法 有 可 能 对 另 一 个 问题 或 在 不 同 的 机 器 上 就 变 成 了 慢 的 。 我 们 将 在 下 一 章 讲 
述 这 些 问 题 ， 并 将 用 这 里 讨论 的 数学 概念 建立 一 个 正式 的 模型 。 





Q 练习 
L1 编写 一 个 程序 解决 选择 问题 。 令 &= NA2。 夯 出 表格 显示 你 的 程序 对 于 N 为 不 同 值 的 
运行 时 间 。 


1.2. 编写 一 个 程序 求解 字谜 游戏 问题 。 
1.3 只 使 用 处 理 IO 的 PrintDigit 函数 ， 编 写 一 个 程序 以 输出 任意 实数 (可 以 是 负 的 )。 
1.4 C 提 供 形 如 


# include filename 


的 语句 ， 它 读 入 文件 filename 并 将 其 插 到 include 语句 处 。include Aa URE, 
换 句 话说 ,文件 filename 本 身 还 可 以 包含 include 语句 , 但 是 显然 一 个 文件 在 任何 
链接 中 都 不 能 包含 它 自己 。 编 写 一 个 程序 ， 使 它 读 和 人 被 include 语句 修饰 的 一 个 文件 


并 且 输 出 这 个 文件 。 

1.5 证 明 下 列 公 式 : 
a. log X<X WAA X> 成 立 
b. log(A”)=B log A 

1.6 求 下 列 各 和 : 


i=LN/2] i 
x1.8  2'"*" (mod 5) B/D? 
1.9 SF, iE 1.2 AE MASE EDS, WEAR FUA: 


N=2 
a XR = Fy —2 
i=] 














b. F<“, Hp $= 二 (1 十 V5) /2 
xxe 给 出 Fy 封闭 形式 的 准确 表达 式 。 
1.10 证明 下 列 公式 : 


Q 参考 文献 


有 许多 好 的 教科 书 涵盖 了 本 章 所 复习 的 数学 内 容 ， 其 中 的 一 小 部 分 为 文献 [1-3，9-11]。 
文献 [9] 是 专门 针对 算法 分 析 的 教材 ， 它 是 本 丛书 的 第 一 卷 ， 并 在 本 书 中 有 多 处 引用 了 它 。 
更 深入 的 材料 包含 于 文献 [5] 中 。 

本 书 假设 读者 具备 C 的 知识 。 偶 尔 我 们 也 加 入 一 些 为 使 叙述 更 清晰 而 必 备 的 材料 。 
我 们 还 假设 读者 熟悉 指针 和 递归 (本 章 中 关于 递归 的 总 结 是 对 递归 的 快速 回顾 )， 在 书 中 适 
当 的 地 方 我 们 将 提供 使 用 它们 的 一 些 提示 。 不 熟悉 这 些 内 容 的 读者 应 该 参考 文献 [12] 或 任 
何 一 本 好 的 中 等 水 平 的 程序 设计 教材 。 
第 见 的 程序 设计 风格 在 多 本 书 中 均 有 所 讨论 ， 如 一 些 经 典 的 文献 [4，6-7]。 
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算法 (algorithm) 是 为 求解 一 个 问题 需要 遵循 的 、 被 清楚 地 指定 的 简单 指令 的 集合 。 

于 一 个 问题 一旦 给 定 某 种 算法 并 且 ( 以 某 种 方式 ) 确 定 其 是 正确 的 ， 那么 ibis 
确定 该 算法 将 需要 多 少 诸如 时 间或 空间 等 资源 量 的 问题 。 如 果 一 个 问题 的 求解 算法 需要 长 
达 一 年 的 时 间 ， 那 么 这 种 算法 就 很 难 有 什么 用 处 。 同 样 ， 一 个 需要 1GB 内 存 的 算法 在 当前 
E i ae 

在 这 一 章 ， 我 们 将 讨论 : 

e et 

e 如 何 将 一 个 程序 的 运行 时 间 从 天 或 年 降低 到 秒 。 

e 粗心 地 使 用 递归 的 后 果 。 

e. 将 一 个 数 自 乘 得 到 其 过 以 及 计算 两 个 数 的 最 大 公 因 数 的 非常 有 效 的 算法 。 


2.1 数学 基础 


估计 算法 资源 消耗 所 需 的 分 析 一 般 说 来 是 一 个 理论 问题 ， 因 此 需要 一 套 正式 的 系统 框 
架 。 我 们 先 从 某 些 数学 定义 开始 。 

全 书 将 使 用 下 列 四 个 定义 : 

EX: 如 果 存 在 正常 数 c Fo m 使 得 当 N>m 时 T(N) 达 cf(N)， 则 记 为 TUN) —OCfOND), 

EN: 如 果 存 在 正常 数 c fo m 使 得 当 N>m 时 T(N) 宇 cg(N)， 则 记 为 TON) —0CXGOND), 

定义 : 当 且 仅 当 T(N)==O(h(N)) 且 TUND —QXOCGNDO RF, TUND—8(COND), 

定义 : wR T(N) 二 OC(p(N)) 且 TION) 天 BCpCN))， 则 AUR die 

这 些 定义 的 目的 是 在 函数 间 建 立 一 种 相对 的 级 别 。 给 定 两 个 函数 ,通常 存在 一 些 点 ， 

在 这 些 点 上 一 个 函数 的 值 小 于 另 一 个 函数 的 值 ， 因 此 ， " f(N) 二 g(N) 这 样 的 声明 是 没有 
什么 意义 的 。 于 是 ， 我 们 比较 它们 的 相对 增长 率 (relative rate of growth)。 当 将 相对 增长 率 
应 用 到 算法 分 析 的 时 候 ， 我们 将 会 明白 为 什么 它 是 重要 的 度量 

虽然 N 较 小 时 1 OOON E EE NT 大 , (AN? 以 更 快 的 速度 增长 ， 因 此 N 最 终 将 更 大 。 在 这 种 
情况 下 ，N=1 000 是 转折 点 。 第 一 个 定义 是 说 ， 最 后 总 会 存在 某 个 点 n, ， 从 它 以 后 cf(NN) 总 是 至 
少 与 TCN) 一 样 大 ， 从 而 若 忽 略 常数 因子 ， 则 SON) > TNR, CERI BIE. TON) = 
1000N, f(N)D—N', m=1 000 而 c=1, 我们 也 可 以 令 n, =10 而 c==100。 因 此 ， 可 以 说 1 000N= 
OCNY) (NN 平方 级 )。 这 种 记 法 称 为 大 O 〇 记 法 。 人 们 常常 不 说 “…… 级 的 ”"， 而 是 说 “大 One. 

如 果 我 们 用 传统 的 不 等 式 来 计算 增长 率 ， 那么 第 一 个 定义 是 说 TCN) 的 增长 率 小 于 等 于 
(过 )f(N) 的 增长 率 。 第 二 个 定义 T(N)= 二 QCg(N))( 念 成 “omega”) 是 说 T(N) 的 增长 率 大 于 等 
于 (三)g(NN) 的 增长 率 。 第 三 个 定义 TON) =OA(N)) Ca “theta it TOCN) 的 增长 率 等 于 
(三 )h(N) 的 增长 率 。 最 后 一 个 定义 TCON) 二 oCp(N))( 念 成 “小 o……”) 说 的 则 是 TCN) 的 增长 
率 小 于 (二 )p(N) 的 增长 率 。 它 不 同 于 大 O， 因 为 大 O 包 含 增长 率 相同 这 种 可 能 性 。 

为 了 证 明 某 个 函数 T(N) 二 OC(f(N))， 我们 通常 不 是 形式 地 使 用 这 些 定义 ,而 是 使 用 
一 些 已 知 的 结果 。 一 般 说 来 ,这 就 意味 着 证 明 ( 或 确定 假设 不 成 立 ) 是 非常 简单 的 计算 并 且 
不 涉及 微 积分 ， 除 非 遇 到 特殊 的 情况 (不 可 能 发 生 在 算法 分 析 中 )。 
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当 我 们 说 TON) =OCFCN)) 时 ， 是 在 保证 函数 TON) 以 不 快 于 f(N) 的 速度 增长 ， 因 此 
f(N) 是 T(N) 的 上 界 (upper bound), 与 此 同时 ，f/(N) 二 Q(T(N)) 意 味 着 T(N) 是 f(N) 的 
下 界 (lower bound). 

举例 来 说 ，N? 增长 得 比 N: 快 ， 因 此 我 们 可 以 说 N* =OCN® ) X NSAN), fOND = 
N? All gCND —2N* 以 相同 的 速率 增长 ， 从 而 NSONA FOND = QCg CNDO BAR IE Tiff 
的 。 当 两 个 函数 以 相同 的 速率 增长 时 ， 是 否 需 要 使 用 记号 “8()” 表 示 可 能 依赖 于 具体 的 上 
下 文 。 直 观 地 说 ， 如 果 g(N)=2N’, BBA g(N)=OC(N'), g(N)=OC(N') fl g(N) = 
O(N’) 从 技术 上 看 都 是 成 立 的 ,但 最 后 一 个 选择 是 最 好 的 答案 。 写 法 gN SOAN ) 不 仅 表 
示 g(N) 二 O(N?) 而 且 还 表示 结果 会 尽 可 能 好 (严密 )。 

我 们 需要 掌握 的 重要 结论 为 : 

法 则 1: 如 果 T,(N)=OCfCN)) BT, (N)=O(g(N)), ABZ 

(a) T; CND +T,(N)=max(OC(f(N)), OC(g(N))). 

(OO T, CN) * T,(N)=OCfCN) * g(N)). 

法 则 2: wR T(N) 是 一 个 k 次 多 项 式 ， W TOND—O(N'D, 

法 则 3: EE HMR, log! N 二 O(N)。 它 告诉 我 们 对 数 增长 得 非常 缓慢 。 


这 些 信息 足以 按照 增长 率 对 大 部 分 常见 的 函数 进行 分 类 ( 见 ”于 
图 2-1) 函数 名 称 


有 几 点 需要 注意 。 首 先 ， 将 常数 或 低 阶 项 放 入 大 O 是 非常 坏 的 logN em 
3f. 不 要 写成 T(N) =O(2N?) s TUN) —OCN* +N). Tex Wi fi di Anm 
情形 下 ， 正 确 的 形式 是 TION)=O(CN )。 这 就 是 说 ， 在 需要 大 OR N? 平方 级 
示 的 任何 分 析 中 ， 可 以 进行 各 种 简化 。 低 阶 项 一 般 可 以 被 忽略 , 而 | M | RE 
常数 也 可 以 弃 掉 。 此 时 ， 要求 的 精度 是 很 低 的 。 

其 次 ,我 们 总 能 通过 计算 极限 lim/(N)/gCN) 来 确定 两 个 函数 fT REIS 
(N) 和 we 必要 的 时 候 可 以 使 用 洛 必 达 法 则 。° 该 极限 可 以 有 四 种 可 能 的 值 : 

e 极限 是 0: 这 意味 着 CN) =o0(g(N)). 
极限 是 CAO: 这 意味 着 /(N) 二 8(g(N))。 

e 极限 是 cc: 这 意味 着 gOND —oCfCND), 
极限 摆动 : 二 者 无 关 ( 在 本 书 中 将 不 会 发 生 这 种 情形 )。 

使 用 这 种 方法 几乎 总 能 算出 相对 增长 率 。 通 常 ， 两 个 函数 ON) A g(N) 间 的 关系 可 以 
用 简单 的 代数 方法 得 到 。 例 如 ， 如果 FCNY=N log NH g(N)=N*’, be 确定 f CN) 和 
gCN) 哪 个 增长 得 更 快 ， 实 际 上 就 是 确定 log N RINT 哪个 增长 得 更 快 。 这 与 确定 log’ N 和 
N 哪个 增长 得 更 快 是 一 样 的 ， 而 后 者 是 个 简单 的 问题 ， 因 为 我 们 已 经 知道 ，N 的 增长 要 快 
F log N 的 任意 次 究 。 因 此 ，g(N) 的 增长 快 于 SOND ASK 。 

另外 ,在 风格 上 还 应 注意 : 不 要 说 成 /(N) 过 Ol(g(N))， 因 为 定义 已 经 隐 含 不 等 式 了 。 



































Q MUREM’ Hopital’s rule) 说 的 是 ， 若 lim ft N)—coH limg(N) —co, WJ lim / ND /gCND — lim f£ OND/g' CND. 
其 中 (和 NN) 和 gCN) 分 别 是 /CN) 和 g(NN) 的 导数 。 
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A 


写成 {(NN) 宇 O(g(NN)) 是 错误 的 ， 它 没有 意义 。 


2.2 模型 


为 了 在 正式 的 框架 中 分 析 算 法 ， 我们 需要 一 个 计算 模型 。 我 们 的 模型 基本 上 是 一 台 标 
准 的 计算 机 ， 在 机 器 中 顺序 地 执行 指令 。 该 模型 有 一 个 标准 的 简单 指令 系统 ， 如 加 法 、 乘 
法 、 比 较 和 赋值 等 。 但 不 同 于 实际 计算 机 情况 的 是 ， 模 型 机 做 任意 一 件 简单 的 工作 都 恰好 
花费 一 个 时 间 单 元 。 为 了 合理 起 见 ， 我 们 将 假设 该 模型 像 一 台 现 代 计算 机 那样 有 固定 范围 
的 整数 (比如 32 位) 并且 不 存在 诸如 和 矩阵 求 逆 或 排序 等 运算 ,它们 显然 不 能 在 一 个 时 间 单 元 
内 完成 。 我 们 还 假设 模型 机 有 无 限 的 内 存 。 


显然 ， 这 个 模型 有 些 缺 点 。 很 明显 ， 在 现实 生活 中 不 是 所 有 的 运算 都 恰好 花费 相同 的 
时 间 。 特 别 是 在 该 模型 中 ， 一 次 磁盘 读 入 计时 同一 次 加 法 ， 虽 然 加 法 一 般 要 快 几 个 数量 级 。 


还 有 ， 由 于 假设 有 无 限 的 内 存 ， 我 们 再 也 不 用 担心 缺 页 中 断 ， 它 可 能 是 个 实际 问题 ， 特 别 
是 对 高 效 的 算法 。 


2.3 要 分 析 的 问题 


要 分 析 的 最 重要 的 资源 一 般 就 是 运行 时 间 。 有 几 个 因素 影响 着 程序 的 运行 时 间 。 有 些 因 
素 ( 如 所 使 用 的 编译 器 和 计算 机 ) 显 然 超出 了 任何 理论 模型 的 范畴 ， 因 此 ， 虽 然 它 们 是 重要 的 ， 
但 是 我 们 在 这 里 还 不 能 处 理 它们 。 剩 下 的 主要 因素 则 是 所 使 用 的 算法 以 及 对 该 算法 的 输入 。 

通常 ， 输 入 的 大 小 是 主要 的 考虑 方面 。 我 们 定义 两 个 郴 数 Toe NMT oora CN)， 分 别 是 
输入 为 N 时 算法 所 花费 的 平均 运行 时 间 和 最 坏 情况 下 的 运行 时 间 。 显 然 ，T,w (N) 
Toor (N)。 如 果 存 在 更 多 的 输入 ， 那 么 这 些 函 数 可 以 有 更 多 的 变量 。 

一 般 说 来 ， 若 无 男 外 的 指定 ， 则 所 需要 的 量 是 最 坏 情 况 下 的 运行 时 间 。 其 原因 之 一 是 
它 对 所 有 的 输入 提供 了 一 个 界限 ， 包 括 特别 坏 的 输入 ， 而 平均 情况 分 析 不 提供 这 样 的 界 。 
男 一 个 原因 是 平均 情况 的 界 计算 起 来 通常 要 困难 得 多 。 在 某 些 情况 下 , “平均 ”的 定义 可 能 
影响 分 析 的 结果 。( 例 如 ,什么 是 下 述 问题 的 平均 输入 ?) 

例如 ， 我 们 将 在 下 一 节 考 虑 下 述 问题 : 

最 大 的 子 序列 和 问题 : 


给 定 整数 4 Ary ，…，Ax( 可 能 有 负数 )， 求 SIAL 的 最 大 值 (为 方便 起 见 ， 如 果 所 有 


整数 均 为 负数 ， 则 最 大 子 序 列 和 为 0) 。 

例如 58,4 —2, 11, —4, 13, —5, —2 HT, ARH 200A A, 8I AD. 

这 个 问题 之 所 以 有 吸引 力 ， 主 要 是 因为 存在 求解 它 的 很 多 算法 ， 而 这 些 算 法 的 性 能 又 
相差 很 大 。 我 们 将 讨论 求解 该 问题 的 四 种 算法 。 这 四 种 算法 在 某 台 计算 机 上 (究竟 是 哪 台 具 
体 的 计算 机 并 不 重要 ) 的 运行 时 间 如 图 2-2 所 示 。 

图 中 有 几 个 重要 的 情况 值得 注意 。 对 于 少量 的 输入 ， 算 法 是 眼 之 间 完 成 ， 因 此 如 果 只 


Fe hif AT SE. EZ IE BRK BER J De ETE RT A FS RE AS LAS 00 25 TAs 
近来 重 写 那些 在 五 年 之 前 编写 的 但 现在 不 再 合理 的 基于 小 输入 量 假设 的 程序 确实 存在 着 巨 
大 的 市 场 。 现 在 看 来 ， 这 些 程序 太 慢 了 ， 因 为 它们 用 的 算法 不 是 好 算法 。 对 于 大 量 的 输入 ， 
算法 4 显然 是 最 好 的 选择 (虽然 算法 3 也 是 可 用 的 )。 






































算法 1 2 3 4 
时 间 O(N?) O(N?) O(N log N) O(N) 
T qw 

N = 10 0.001 03 0.000 45 0.000 66 0.000 34 
输入 N = 100 0.470 15 0.011 12 0.004 86 0.000 63 
大 小 N = 1000 448.77 1.1233 0.058 43 0.003 33 

N = 10 000 NA 111.13 0.686 31 0.030 42 

N = 100 000 NA NA 8.0113 0.298 32 








图 2-2 计算 最 大 子 序列 和 的 几 种 算法 的 运行 时 间 ( 秒 ) 

其 次 ， 图 中 所 给 出 的 时 间 不 包括 读 入 数据 所 需要 的 时 间 。 对 于 算法 4， 仅 仅 从 磁盘 读 人 
数据 所 用 的 时 间 很 可 能 在 数量 级 上 比 求解 上 述 问 题 所 需要 的 时 间 还 要 多 。 这 是 许多 有 效 算 
法 中 的 典型 特点 。 数 据 的 读 入 一 般 是 个 瓶颈 ， 一 旦 读 入 数据， 问题 就 会 迅速 解决 。 但 是 ， 
对 于 低 效率 的 算法 情况 就 不 同 了 ， 它 必然 要 耗费 大 量 的 计算 机 资源 。 因 此 只 要 可 能 ， 使 得 
算法 足够 有 效 而 不 致 成 为 问题 的 瓶颈 是 非常 重要 的 。 

图 2-3 指出 这 四 种 算法 运行 时 间 的 增长 率 。 尽 管 该 图 只 包含 N 从 10 到 100 的 值 ， 但 是 
相对 增长 率 还 是 很 明显 的 。 虽然 算 法 3 的 图 看 起 来 是 线性 的 ,但 是 用 一 把 直 尺 (或 是 一 张 
纸 ) 容 易 验 证 它 并 不 是 直线 。 图 2-4 显示 对 于 更 大 值 的 算法 性 能 。 该 图 戏剧 性 地 描述 出 ， 即 


算法 1:O(N3) 
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0 10 20 30 40 50 60 70 80 90 100 
图 2-3 各 种 计算 最 大 子 序 列 和 的 算法 图 ( 横 坐 标 为 N， 纵 坐标 为 毫秒 ) 











算法 I: O(N”)  ， 
算法 2: O(N”) 
X3: O(NlogN) 
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图 2-4 各 种 计算 最 大 子 序列 和 的 算法 图 ( 横 坐 标 为 N， 纵 坐标 单位 为 秒 ) 
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使 输入 量 的 大 小 是 适度 的 ， 低 效 算法 依旧 无 用 。 


2.4 运行 时 间 计算 


有 几 种 方法 可 以 估计 一 个 程序 的 运行 时 间 。 前 面 的 图 表 是 凭 经验 得 到 的 。 如 果 两 个 
程序 花费 的 时 间 大 致 相同 ， 要 确定 哪个 程序 更 快 的 最 好 方法 很 可 能 就 是 将 它们 编码 并 
运行 ! 

一 般 来 说 ， 存 在 几 种 算法 思想 ， 而 我 们 总 愿意 尽早 去 除 那些 不 好 的 算法 思想 ， 因 此 ， 
通常 需要 对 算法 进行 分 析 。 不 仅 如 此 ， 进 行 分 析 的 能 力 还 有 助 于 洞察 到 如 何 设计 有 效 的 算 
法 。 一 般 说 来 ， 分 析 还 能 准确 确定 需要 仔细 编码 的 瓶颈 。 

为 了 简化 分 析 ， 我 们 将 采纳 如 下 的 约定 : 不 存在 特定 的 时 间 单 元 。 因 此 ,我们 抛弃 前 
导 常 数 。 我 们 还 将 抛弃 低 阶 项 ， 从 而 要 做 的 就 是 计算 大 O 运行 时 间 。 由 于 大 OO 是 一 个 上 界 ， 
因此 我 们 必须 仔细 ， 绝 不 要 低估 程序 的 运行 时 间 。 实 际 上 ， 分析 的 结果 为 程序 在 一 定 的 时 
间 范 围 内 能 够 终止 运行 提供 了 保障 。 程 序 可 能 提前 结束 ， 但 绝 不 可 能 延 后 。 


2.4.1 一 个 简单 的 例子 
这 里 是 计算 DIP 的 一 个 简单 的 程序 片段 。 - i 
int 


Sum( int N ) 
{ 


int i, PartialSum; 


Pei Ley PartialSum = 0; 
VR for( 1 = 1; 1 <= N; i++ ) 
Z8 357 Partiadlsum += 1 * 1 * 1; 
/* 4*/ return PartialSum; 

} 


对 这 个 程序 的 分 析 很 简单 。 声 明 不 计时 间 。 第 1 行 和 第 4 行 各 占 一 个 时 间 单 元 。 第 3 
行 每 执行 一 次 占用 4 个 时 间 单 元 (两 次 乘法 、 一 次 加 法 和 一 次 赋值 )， 而 执行 N 次 共 占 用 
AN 个 时 间 单 元 。 第 2 行 在 初始 化 i、 测 试 SN 和 对 i 的 自 增 运算 中 隐 含 着 开销 。 第 2 行 的 
总 开销 是 : 初始 化 占 1 个 时 间 单 元 ， 所 有 的 测试 占 N 十 1 个 时 间 单 元 ， 以 及 所 有 的 自 增 运算 
rh ON 个 时 间 单 元 ， 共 2N 十 2 个 时 间 单 元 。 我 们 忽略 调用 函数 和 返回 值 的 开销 ， 得 到 的 总 量 
是 6N 十 4。 因 此 ， 我们 说 该 函数 是 OCN) 的 。 

如 果 我 们 每 次 分 析 一 个 程序 都 要 演示 所 有 这 些 工 作 ， 那么 这 项 任务 很 快 就 会 变 成 不 可 
行 的 工作 。 幸 运 的 是 ， 由 于 我 们 有 了 大 O 的 结果 ， 因 此 就 存在 许多 可 以 采取 的 简化 并 且 不 
影响 最 后 的 结果 。 例 如 ， 第 3 行 ( 每 次 执行 时 ) 显 然 是 OG1) 语 句 ， 因 此 精确 计算 它 究竟 是 2、 
3 还 是 4 个 时 间 单 元 是 思春 的 ， 这 无 关 紧 要 。 第 1 行 与 for 循环 相 比 显然 是 不 重要 的 ， 所 
以 在 这 里 花费 时 间 也 是 不 明智 的 。 这 使 得 我 们 得 到 车 干 一 般 法 则 。 


2.4.2 一 般 法 则 

法 则 1 一 一 for 循环 : 

一 次 for 循环 的 运行 时 间 至 多 是 该 for 循环 内 语句 (包括 测试 ) 的 运行 时 间 乘 以 选 代 
的 次 数 。 

法 则 2— KEN for 循环 : 

从 里 向 外 分 析 这 些 循环 。 在 一 组 嵌 套 循环 内 部 的 一 条 语句 总 的 运行 时 间 为 该 语句 的 运 
行 时 间 乘 以 该 组 所 有 的 for 循环 的 大 小 的 乘积 。 

作为 一 个 例子 ， 下 列 程序 片段 的 运行 时 间 为 O(N ) : 

fort i = 0; i « N; i++ ) 

for( j = 0; j <N; j++ ) 
k++; 

法 则 3 一 一 顺序 语句 : 

将 各 个 语句 的 运行 时 间 求 和 即 可 (这 意味 着 ， 其 中 的 最 大 值 就 是 所 得 的 运行 时 间 ， 见 
2. 1 节 的 法 则 1(a) ) 。 

举 一 个 例子 ， 下面 的 程序 片段 先 用 去 O(N)， 再 花费 O(N?*)， 总 的 开销 也 是 OCN2 ) : 


for( i = 0; i « N; i++ ) 





ALi] =0; 
for( i = 0; i«N; ict) 
for( j = 0; j < N; j++) 
* ALi J += AL jG] +i + 3; 
法 则 4 if/else i& 8: 
对 于 程序 片段 
ifC Condition ) 
S1 
else 
S2 


一 个 if/else 语句 的 运行 时 间 从 不 超过 判断 的 时 间 加 上 S1 和 S2 中 运行 时 间 较 长 者 的 
总 的 运行 时 间 。 

显然 ， 在 某 些 情 形 下 这 么 估计 有 些 过 高 ， 但 绝 不 会 估计 过 低 。 

其 他 的 法 则 都 是 显而易见 的 ， 但 是 ， 分 析 的 基本 策略 是 从 内 部 (或 最 深层 部 分 ) 向 外 展 
开 的 。 如 果 有 函数 调用 ， 那么 这 些 调用 要 首先 分 析 。 如 果 有 递归 过 程 ， 那么 存在 几 种 选择 。 
若 递 归 实 际 上 只 是 稍 加 掩饰 的 for 循环 ， 则 分 析 通 常 是 很 简单 的 。 例 如 ， 下 面 的 函数 实际 
上 就 是 一 个 简单 的 循环 ， 从 而 其 运行 时 间 为 ON): 

long int 

Factorial( int N ) 

: ifC N <= 1) 

return 1; 


else 
return N * Factorial( N - 1); 


[21] 
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这 个 例子 中 对 递归 的 使 用 实际 上 并 不 好 。 当 递归 使 用 得 当时 ,将 其 转换 成 一 个 简单 的 
循环 结构 是 相当 困难 的 。 在 这 种 情况 下 ,分析 将 涉及 求解 一 个 递 推 关系 。 为 了 观察 到 这 种 
可 能 发 生 的 情形 ， 考 虑 下 列 程序 ， 实 际 上 它 对 递归 使 用 的 效率 低 得 令 人 诈 异 。 


long int 
Fib( int N ) 
{ 
He de ifC N <= 1) 
Peers return 1; 
else 
/* 3*/ return FibC N - 1) + Fib( N - 2); 
l 


初 看 起 来 ， 该 程序 似乎 对 递归 的 使 用 非常 聪明 。 可 是 ， 如 果 将 程序 编码 ， 且 赋予 N 大 
约 30 的 值 并 运行 ， 那么 这 个 程序 的 效率 低 得 吓人 。 分 析 十 分 简单 。 令 T(N) 为 函数 
Fib(NN) 的 运行 时 间 。 如 果 N==0 或 N= 二 1， 则 运行 时 间 是 某 个 常数 值 ， 即 第 1 行 上 做 判断 
以 及 返回 所 用 的 时 间 。 因 为 常数 并 不 重要 ， 所 以 我 们 可 以 说 TC — TO) — 1, HF N 为 其 他 
值 的 运行 时 间 则 需要 相对 于 基准 情形 的 运行 时 间 来 度量 。 若 N 二 2， 则 执行 该 函数 的 时 间 是 第 
1 行 上 的 常数 工作 加 上 第 3 行 上 的 工作 。 第 3 行 由 一 次 加 法 和 两 次 函数 调用 组 成 。 由 于 函数 调 
用 不 是 简单 的 运算 ， 必 须 通 过 它们 本 身 来 分 析 。 第 一 次 函数 调用 是 FibCN 一 1)， 从 而 按照 工 
的 定义 ， 它 需要 TCN 一 1) 个 时 间 单 元 。 类 似 的 论证 指出 ， 第 二 次 函数 调用 需要 TCN 一 2) 个 时 
间 单 元 。 此 时 总 的 时 间 需 求 为 TCN 一 1) 十 TC(N 一 2) 十 2:， 其 中 “2” 指 的 是 第 1 行 上 的 工作 加 
上 第 3 行 上 的 加 法 。 于 是 对 于 NS 我 们 有 下 列 关 于 Fipb( NN) 的 运行 时 间 公 式 : 

T(N) =T(N—1)+T(N—2)+2 

但 是 Fib(N) 二 Fibp(N 一 1) 十 Fib(N 一 2)， 因 此 由 归纳 法 容易 证 明 TON) >Fib(N). 
在 1.2. 5 节 我 们 证 明 过 Fib(N)<(5/3)%, 类 似 的 计算 可 以 证 明 ( 对 于 NI D Fib(N)>S> 
(3/2)%, 可见 ， 这 个 程序 的 运行 时 间 以 指数 的 速度 增长 。 这 大 致 是 最 坏 的 情况 。 通 过 保留 
一 个 简单 的 数组 并 使 用 一 个 for 循环 ， 运 行 时 间 可 以 被 实质 性 地 减少 下 来 。 

这 个 程序 之 所 以 缓慢 ， 是 因为 存在 大 量 多 余 的 工作 要 做 ,违反 了 在 1.3 35 SCR I 3 1H 
的 第 四 条 基本 法 则 (合成 效益 法 则 )。 注 意 ， 在 第 3 行 上 的 第 一 次 调用 即 Fib(N 一 1) 实 际 上 计 
算 了 FibCN 一 2)。 随 后 这 个 信息 被 抛弃 而 在 第 3 行 上 的 第 二 次 调用 时 又 重新 计算 了 一 遍 。 抛 
弃 的 信息 量 递 归 地 合成 起 来 并 导致 巨大 的 运行 时 间 。 这 或 许 是 格言 “计算 任何 事情 不 要 超过 
一 次 ”的 最 好 示例 ,但 你 不 能 因此 害怕 使 用 递归 。 本 书 中 我 们 将 随处 看 到 递归 的 出 色 用 例 。 








2.4.8 最 大 子 序列 和 


现在 我 们 将 要 叙述 四 个 算法 来 求解 早先 提出 的 最 大 子 序 列 和 问题 。 第 一 个 算法 在 图 2-5 
中 表述 ， 它 只 是 穷 举 式 地 尝试 所 有 的 可 能 。for 循环 中 的 循环 变量 反映 C 中 的 数组 从 0 JF 
始 而 不 是 从 1 开始 这 样 一 个 事实 。 再 有 ， 本 算法 并 不 计算 实际 的 子 序 列 ， 实 际 的 计算 还 要 
添加 一 些 额 外 的 代码 。 

该 算法 肯定 会 正确 运行 (这 不 应 该 花 太 多 的 时 间 去 证 明 )。 运 行 时 间 为 O(N’ )， 这 完全 
取决 于 第 5 行 和 第 6 行 ， 第 6 行 由 一 个 含 于 三 重 舱 套 for 循环 中 的 O(1) 语 句 组 成 。 第 2 行 


上 的 循环 大 小 为 N。 
第 2 个 循环 大 小 为 N 一 i， 它 可 能 很 小 ， 但 也 可 能 是 N。 我 们 必须 假设 最 坏 的 情况 ， 而 








这 可 能 会 使 得 最 终 的 界 有 些 大 。 第 3 
int 
个 循环 的 大 小 为 313 1.5 我 们 也 要 MaxSubsequenceSum( const int A[ ], int N ) 
假设 它 的 大 小 为 N。 因 此 总 数 为 saree ey 
OU *+N*N*N)=O(N'), 语句 1 js ls/ Waste Bs 
ate y f® 2*/ for( 1 = 0; 1 < Ni i ) 

总 共 的 开销 只 是 O(1)， 而 语句 7 和 /* 3*/ for( j = i; aN j+) 
8 的 总 共 开 销 也 只 不 过 是 OCND 因 | pa ge, Gawd 
为 它们 只 是 两 层 循环 内 部 的 简单 表 | A em 
达 式 。 /* 7*/ if( ThisSum > MaxSum ) 

事实 E. 考虑 到 | 这 些 循环 的 实 实 /* 8*/ MaxSum = ThisSum; 





} 
际 大 小 ， 更 精确 的 分 析 指 出 答案 是 g= 9*7 return MaxSum; 
QB(N”)， 而 我 们 上 面 的 估计 高 出 一 个 





因子 6( 不 过 这 并 无 大 碍 ， 因 为 常数 图 2-5 算法 1 
不 影响 数量 级 )。 一 般 说 来 ， 在 这 类 问题 中 上 述 结论 是 正确 的 。 精 确 的 分 析 由 和 D D 71 


得 到 ,该 和 指出 程序 的 第 6 行 被 执行 的 次 数 。 使 用 1.2. 3 节 中 的 公式 可 以 对 该 和 从 内 到 外 
求 值 。 尤其 是 我 们 将 用 到 前 NN 个 整数 求 和 以 及 前 NN 个 平方 数 求 和 的 公式 。 首 先 ， 有 


y= j-i+l 
接着 ， 我 们 得 到 





N-—1 é . 
Sici MEL, 


这 个 和 数 是 对 前 N 一 i 4 个 整数 求 和 而 算得 。 为 完成 全 部 计算 ， 我 们 有 


Y UN —1-- DON — D 
5j 





2 UN =r EINEN (1-2) 
2 


-1ye -(N+Ž ne IO +3N+2) D1 
21 N(N+DQN+) N(N+1) , N?+3N+2 
8 a. n 


_N°4+3N?+2N 
6 


我 们 可 以 通过 撤除 一 个 for 循环 来 避免 立方 运行 时 间 。 不 过 这 不 总 是 可 能 的 ， 在 这 种 情 
况 下 算法 中 出 现 大 量 不 必要 的 计算 。 为 了 改进 这 种 低 效 率 的 算法 ， 可 以 通过 观察 XA = 














Ay + YA. 而 看 出 算法 1 中 第 5 行 和 第 6 行 上 的 计算 过 分 地 耗 时 了 。 图 2-6 指出 一 种 改进 的 


21 
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算法 。 算 法 2 显然 是 OCN?) 的 ， 

对 这 个 问题 有 一 个 递归 且 相 对 复 
杂 的 O(N log N) 解 法 ,我 们 现在 就 
来 描述 它 。 ra ts 
性 的 ) 解 法 ， 这 个 算法 就 会 是 体现 递 
pa aie 该 方法 采用 一 
种 “分 治 ”(divide-and-conquer ) 策 
略 。 其 想法 是 把 问题 分 成 两 个 大 致 相 
等 的 子 问 题 ， 然 后 递归 地 对 它们 求 
解 ， 这 是 “分 ”部 分 。“ 治 ”阶段 将 
两 个 子 问题 的 解 合 并 到 一 起 并 可 能 再 
做 些 少 量 的 附加 工作 ， 最 后 得 到 整个 
问题 的 解 。 

在 我 们 的 例子 中 ， 最 大 子 序列 和 
可 能 在 三 


输入 数据 的 中 部 从 而 占据 左右 两 半 部 分 。 | 
可 以 通过 求 出 前 半 部 分 的 最 大 和 (包含 前 半 部 分 的 最 后 一 


含 后 半 部 分 的 第 一 个 元 素 ) 而 得 到 。 


输入 : 


”前 半 部 分 — 


对 它 的 分 析 甚 至 比 前 面 的 分 析 还 简单 。 








int 
MaxSubSequenceSum( const int A[ ], int N ) 


int ThisSum, MaxSum, i, j; 


MaxSum = 0 
for( i = 0; i « Nj; i++ ) 


ThisSum = 0; 
for( j = i; j < Ny j++ 7 


ThisSum += A[ j ]; 


if( ThisSum > MaxSum ) 
MaxSum = ThisSum; 


} 


return MaxSum; 





2-6 算法 2 


:处 出 现 。 或 者 整个 出 现在 输入 数据 的 左 半 部 ， 或 者 整个 出 现在 右 半 部 ,或 者 跨越 
前 两 种 情况 可 以 递归 求解 。 第 三 种 情况 的 最 大 和 
个 元 素 ) 以 及 后 半 部 分 的 最 大 和 ( 包 
然后 将 这 两 个 和 加 在 一 起 。 作 为 一 个 例子 ， 考虑 下 列 





a: -— 5 


其 中 前 半 部 分 的 最 大 子 序列 和 为 6( 从 元 素 A 到 As), ifii 


(从 元 素 As 到 A>). 
前 半 部 分 包含 其 最 后 一 


个 元 素 的 最 大 和 是 7( 从 元 素 A; 到 A; ) 。 


(Mic A, 8| A). 
我 们 看 到 ， 
X. TÉ. FRN IL 
有 必要 对 算法 3 的 程序 进 
及 左 (Left) 边 界 和 右 (Right) 边 界 ，E 


负 时 它 就 是 最 大 和 子 序列 。 


程序 中 的 小 扰动 有 可 能 致使 这 种 混乱 产生 )。 


第 8 一 12 行 以 及 第 13 一 17 行 计算 到 达 中 间 分 界 处 的 两 个 最 大 和 的 和 数 。 这 


=2 


个 元 素 的 最 大 和 是 4( 从 元 素 A, BAD. m 
因此 ， 横 跨 这 两 部 分 且 通 过 中 间 的 最 大 和 为 4 十 7 二 11 


在 生成 本 例 中 最 大 子 序 列 和 的 三 
图 2-7 提出 了 这 种 策略 的 一 种 实现 手段 
井 行 一 些 说 明 。 递 归 过 + 程 调用 的 一 般 形 式 是 传递 输入 的 数组 以 
它们 界定 了 数组 待 处 理 的 部 分 。 单 行 驱 动 程序 通过 传 
递 数组 以 及 边界 0 和 N 一 1 而 启动 该 过 程 。 

第 1 一 4 行 处 理 基 准 情形 。 如 果 Left==Right， 


-种 方法 中 ， 最 好 的 方法 是 包含 两 部 分 的 元 


那么 只 有 一 





半 部 分 的 最 大 子 序列 和 为 8 


后 半 部 分 包含 其 第 一 


个 元 素 ， 并 且 当 该 元 素 非 
Left>Right 的 情况 是 不 可 能 出 现 的 ， 除非 N 是 负数 (不 过 ， 
第 6 行 和 第 7 行 执行 两 次 递归 调用 。 我 们 可 以 
总 是 对 小 于 原 问 题 的 问题 进行 递归 调用 ,但 程序 中 的 小 扰动 有 可 能 破坏 这 个 特性 。 
两 个 最 大 和 的 和 


为 跨越 左右 两 边 的 最 大 和 。 伪 例 程 (pseudoroutine)Max3 返回 这 三 个 可 能 的 最 大 和 中 的 最 
大 者 。 





static int 
MaxSubSum( const int A[ ], int Left, int Right ) 
{ 
int MaxLeftSum, MaxRightSum; 
int MaxLeftBorderSum, MaxRightBorderSum; 
int LeftBorderSum, RightBorderSum; 
int Center, i; 
f* 1*j if( Left == Right ) /* Base Case */ 
[= 250 ifC AL Left ] > 0) 
fF 3*/ return A[ Left ]; 
else 
/[* 4*7 return 0; 
/* 5*/ Center - ( Left « Right ) / 2; 
/* 6*/ MaxLeftSum - MaxSubSum( A, Left, Center ); 
f* 7 MaxRightSum = MaxSubSum( A, Center + 1, Right ); 
/* 8*/ MaxLeftBorderSum = 0; LeftBorderSum = 0 
[* 9*/ for( i = Center; i >= Left; i-- ) 
{ 
/*10*/ LeftBorderSum += A[ i ]; 
/*11*/ if( LeftBorderSum » MaxLeftBorderSum ) 
/*12*/ MaxLeftBorderSum - LeftBorderSum; 
} 
[R138 MaxRightBorderSum = 0; RightBorderSum = 0; 
/*14*/ for( i = Center + 1; i <= Right; i++ ) 
{ . 
, /*15*/ RightBorderSum += A[ i J; 
/*16*/ if( RightBorderSum > MaxRightBorderSum ) 
FS MaxRightBorderSum = RightBorderSum; 
} 
/*18*/ return Max3( MaxLeftSum, MaxRightSum, 
/*19*/ MaxLeftBorderSum + MaxRightBorderSum ); 
} 
int 
MaxSubsequenceSum( const int A[ ], int N ) 
return MaxSubSum( A, 0, N- 1); 
} 











图 2-7 算法 3 


显然 ， 编 程 时 ， 算 法 3 比 前 面 两 种 算法 需要 更 多 的 精力 。 然 而 ， 程 序 短 并 不 总 意味 着 
程序 好 。 正 如 我 们 在 前 面 显 示 算 法 运行 时 间 的 图 中 所 看 到 的 ， 除 最 小 的 输入 外 ， 该 算法 比 
前 两 个 算法 明显 要 快 。 

对 运行 时 间 的 分 析 方 法 与 分 析 计 算 斐 波 那 契 数 程序 时 的 方法 类 似 。 令 T(N) 是 求解 大 
小 为 N 的 最 大 子 序 列 和 问题 所 花费 的 时 间 。 如 果 N= 二 1， 则 算法 3 花费 某 个 时 间 常 量 执行 
程序 的 第 1~4 行 ， 我 们 称 之 为 一 个 时 间 单 元 。 于 是 ，T(1) 二 1。 否 则 ， 程 序 必须 运行 两 次 
递归 调用 ， 即 在 第 9—17 行 之 间 的 两 个 for 循环 ， 还 需 某 个 小 的 短 记 量 ， 如 在 第 5 行 和 第 
18 行 。 这 两 个 for 循环 接触 到 从 A. 到 A、-1 的 每 一 个 元 素 ， 而 在 循环 内 部 的 工作 量 是 常 
量 ， 因 此 ， 在 第 9 一 17 行 花 费 的 时 间 为 OON)。 第 1 一 5 行 以 及 第 8、13 和 18 行 上 的 程序 的 
工作 量 都 是 常量 ， 从 而 与 OCN) 相 比 可 以 忽略 。 其 余 就 是 第 6 和 7 行 上 运行 的 工作 。 这 两 行 
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求解 大 小 为 N/2 的 子 序 列 问题 (假设 N 是 偶数 )。 因 此 ， 这 两 行 每 行 花费 T(N/2) 个 时 间 单 
元 ， 共 花费 2T(N/2) 个 时 间 单 元 。 算 法 3 花费 的 总 时 间 为 2T(N/2) 十 O(N)。 我 们 得 到 方 
程 组 

T= 

T(N)= 2T(N/2) + OWN) 

为 了 简化 计算 ， 可 以 用 N 代替 上 面 方程 中 的 O(N) 项 。 由 于 T(N) 最 终 还 是 要 用 大 O 
来 表示 ， 因 此 这 么 做 并 不 影响 答案 。 在 第 7 ne. 我们 将 会 看 到 如 何 严格 地 求解 这 个 方程 。 
至 于 现在 ， 如 果 TCN)==2T(N/2) 十 N， 且 TXOD—1, 那么 T(22)—4—2«*2, T(4)—212—4 «3, T 
(8)=32=8 x4, LA TCX160 —80—16 * 5。 其 形式 是 显然 的 并 且 可 以 推导 出 来 ， 即 若 N= 二 2 ， 则 
TON)—N * (R+1)=N log N+ N=OU(N log ND, 

这 个 分 析 假 设 N 是 偶数 ,不 然 N/2 就 不 确定 了 。 通 过 该 分 析 的 递归 性 质 可 知 ， 实 际 上 
RA N 是 2 的 寡 时 ， 结 果 才 是 合理 的 ， 否 则 我 们 最 终 要 遇 到 大 小 不 是 偶数 的 子 问题 ， 方 
程 就 无 效 了 。 当 N 不 是 2 的 寡 的 时 候 ， 我 们 多 少 需要 更 加 复杂 一 些 的 分 析 ， 但 是 大 O 的 结 
果 是 不 变 的 。 

在 后 面 的 章节 中 ， 我 们 将 看 到 递 














归 的 几 个 漂亮 的 应 用 。 这 里 ， 我 们 还 tbc DRE const int AL ], int N ) 
是 介绍 求解 最 大 子 序列 和 的 第 四 种 广 i gi 
法 ,该 算法 实现 起 来 要 比 递归 算法 简 Aay Tiesu = MaxSal e 0; 
单 而 且 更 为 有 效 ， 如 图 2-8 所 示 。 和 
不 难 理解 为 什么 时 间 的 界 是 正确 | CU SORT 
的 ,但 是 要 明白 为 什么 算法 是 正确 可 | ^: 和/ M oo 
行 的 会 费 些 思考 ， 我 们 把 它 留 给 读者 | 和 SY ui Se Mai 
去 完成 。 该 算法 的 一 个 附带 优点 是 ，| js gsj betur Maxsum; | 
它 只 对 数据 进行 一 次 扫描 ， 一 旦 完成 } | 
对 A[ 门 的 读 入 和 处 理 ， 就 不 再 需要 
图 2-8 算法 4 


记忆 它 了 。 因 此 ， 如 果 数 组 在 磁盘 或 

磁带 上 ， 它 就 可 以 被 顺序 读 入 ,在 主 存 中 不 必 存 储 数组 的 任何 部 分 。 不 仅 如 此 , 在 任意 时 
刻 ， 算 法 都 能 对 它 已 经 读 入 的 数据 给 出 子 序 列 问题 的 正确 答案 (其 他 算法 不 具有 这 个 特性 )。 
具有 这 种 特性 的 算法 叫 作 联机 算法 (on-line algorithm)。 仅 需要 常量 空间 并 以 线性 时 间 运 行 
的 联机 算法 几乎 是 完美 的 算法 。 


2.4.4 ”运行 时 间 中 的 对 数 


分 析 算 法 最 混乱 的 方面 大 概 集中 在 对 数 上 面 。 我 们 已 经 看 到 ， 某 些 分 治 算法 将 以 O(N 
log N) 时 间 运 行 。 除 分 治 算法 外 ， 可 将 对 数 最 常 出 现 的 规律 概括 为 下 列 一 般 法 则 : 如 果 一 
个 算法 用 常数 时 间 (O(1)) 将 问题 的 大 小 削减 为 其 一 部 分 (通常 是 1/2)， 那 么 该 算法 就 是 
O(log N) 的 。 另 一 方面 ， 如 果 使 用 常数 时 间 只 是 把 问题 减少 一 个 常数 (如 将 问题 减少 D. 
那么 这 种 算法 就 是 O(N) 的 。 
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显然 ， 只 有 一 些 特 殊 种 类 的 问题 才能 够 呈现 出 O(log N) 型 。 例 如 ， 若 输入 N 个 数 ， 则 一 
个 算法 只 是 把 这 些 数 读 入 就 必须 耗费 QCN) 的 时 间 。 因 此 ， 当 我 们 谈 到 这 类 问题 的 O(log N) 算 
法 时 ， 通 常 都 是 假设 输入 数据 已 经 提前 读 入 。 下 面 提供 具有 对 数 特点 的 三 个 例子 。 

对 分 查找 

第 一 个 例子 通常 叫 作 对 分 查找 (binary search， 也 叫 作 二 分 查找 、 折 半 查 找 ) 。 


对 分 查找 : 给 定 一 个 整数 X 和 整数 A,。，Al，…，A、 1， 后 者 已 经 预先 排序 并 在 内 存 
To RRBA =X FER. WRX 不在 数据 中 ， 则 返回 i 二 一 1。 

明显 的 解法 是 从 左 到 右 扫 描 数 据 ， 其 运行 花费 线性 时 间 。 然 而 ,这 个 算法 没有 用 到 数 
据 已 经 排序 的 事实 ， 这 就 使 得 算法 很 可 能 不 是 最 好 的 。 一 个 好 的 策略 是 验证 X 是 否 是 居中 
的 元 素 。 如 果 是 ， 则 答案 就 找到 了 。 如 果 X 小 于 居中 元 素 ， 那 么 我 们 可 以 应 用 同样 的 策略 
于 居中 元 素 左 边 已 排序 的 子 序列 ; 同 理 ， 如 果 X 大 于 居中 元 素 ， 那 么 我 们 检查 数据 的 右 半 
部 分 。( 也 存在 可 能 会 终止 的 情况 。) 图 2-9 列 出 了 对 分 查找 的 程序 (其 答案 为 Mida)。 图 中 的 
程序 反映 了 C 语言 数组 下 标 从 0 开始 的 惯例 。 














int 
BinarySearch( const ElementType A[ J], ElementType X, int N ) 
{ 
int Low, Mid, High; 
y* ti A Low = 0; High =N - 1; 
^ /[* 2*f while( Low <= High ) 
{ 
/* 3*/ Mid = ( Low + High ) / 2; 
fe Arj ifC AL Mid J « X) 
[* SEY Low = Mid + 1; 
else 
y* 657 TEC A[ Mid] sx ) 
J* 77 High = Mid - 1; 
else 
y* 8*/ return Mid; /* Found */ 
/* 9*/ return NotFound; /* NotFound is defined as -1 */ 
} 
图 2-9 对 分 查找 


显然 ,每 次 迭代 在 循环 内 的 所 有 工作 花费 为 0(1)， 因 此 分 析 时 需要 确定 循环 的 次 数 。 
循环 从 High—Low-— N—1 开始 并 在 High 一 Low 宇 一 1 结束 。 每 次 循环 后 High 一 Low If) fti 
至 少将 该 次 循环 前 的 值 折 半 ， 于 是 ,循环 的 次 数 最 多 为 [ log(N 一 1)1 二 2。( 例 如 ， 若 
High 一 Low 二 128， 则 在 各 次 迭代 后 High— Low 的 最 大 值 是 64. 32. 16, 8, 4. 2, 1, 
0. 一 1。) 因 此 ， 运 行 时 间 是 O(log N)。 等 价 地 ,我 们 也 可 以 写 出 运行 时 间 的 递 推 公式 ， 
不 过 ， 当 我 们 理解 实际 在 做 什么 以 及 为 什么 这 样 做 时 ,这 种 强行 写 公 式 的 做 法 通常 没有 
必要 。 

对 分 查找 可 以 看 作 我 们 的 第 一 个 数据 结构 实现 方法 ， 它 提供 了 在 O(log N) 时 间 内 的 
Find( 查 找 ) 操 作 , 但 是 所 有 其 他 操作 (特别 是 Insert( 插 入 ) 操 作 ) 均 需要 O(N) 时 间 。 在 数 
据 稳定 ( 即 不 允许 插入 操作 和 删除 操作 ) 的 应 用 中 ， 这 可 能 是 非常 有 用 的 。 此 时 输入 数据 需 
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一 次 排序 ， 但 是 此 后 的 访问 会 很 快 。 例 如 ， 有 一 个 程序 需要 保留 (产生 于 化 学 和 物理 中 
的 ) 元 素 周期 表 的 信息 。 这 个 表 是 相对 稳定 的 ， 因 为 很 少 添加 新 的 元 素 。 元 素 名 可 以 始终 是 
排序 的 。 由 于 只 有 大 约 110 种 元 素 ， 因 此 找到 一 个 元 素 最 多 需要 访问 8 次 。 要 是 执行 顺序 
查找 就 会 需要 多 得 多 的 访问 次 数 。 

欧 几 里 得 算法 
第 二 个 例子 是 计算 最 大 公 因 数 的 欧 几 里 得 算法 。 两 个 整数 的 最 大 公 因 数 (Gcd) 是 同时 整 





除 二 者 的 最 大 整数 。 于 是 ，Gcd(50，15 ) 三 7 
| | ; iH d 
5, Al 2-10 中 的 算法 计算 GedC M. ND. T& Gent unidad int M, unsigned int N ) 
MEN, (W NM, Mff AY BK unsigned int Rem; 
迭代 将 它们 互相 交换 。) /* 1*/ while( N>0) 
算法 连续 计算 余数 直到 余数 是 0 为 止 ，| poe, | Rem-MxNn 
最 后 的 非 零 余数 就 是 最 大 公 因 数 。 因 此 ,如 | Liu, et AA 
果 M=1 989 和 N=1 590， 则 余数 序列 是 | js se,  Leturn m; 
399, 393, 6, 3, 0. 从 而 ，Gecd (1 989, 











1 590) 王 3。 正 如 例子 所 表明 的 ， 这 是 一 个 
图 2-10 欧 几 里 得 算法 


快速 算法 。 
如 前 所 述 ， 估 计算 法 的 整个 运行 时 间 依 赖 于 确定 余数 序列 究竟 有 多 长 。 虽 然 ,log N 看 


似 是 理想 中 的 答案 ,但 是 根本 看 不 出 余数 的 值 按 照常 数 因子 递减 的 必然 性 ， 因 为 我 们 看 到 ， 
例 中 的 余数 从 399 仅仅 降 到 393。 事 实 上 ， 在 一 次 迭代 中 余数 并 不 按照 一 个 常数 因子 递减 。 
然而 ， 我 们 可 以 证 明 ,， EREA Ma 
至 多 是 2 log N—O(log N)， 从 而 得 到 运行 时 间 。 这 个 证 明 并 不 难 ， 因 此 我 们 将 它 放 在 这 
里 ， 它 可 根据 下 列 定理 直接 推出 。 

定理 2. 1 de M>N, 8) M mod N<M/2, 

证 明 : 存在 两 种 情形 。 如 果 N 三 M/2， 则 由 于 余数 小 于 N， 故 定理 在 这 种 情形 下 成 
立 。 另 一 种 情形 是 NIM/2. 但 是 此 时 M 仅 含有 一 个 N， 从 而 余数 为 M 一 N=M/2， 定 


从 上 面 的 例子 来 看 ，2 log N 大 约 为 20， 而 我 们 仅 进行 了 7 次 运算 ， 因此 有 人 会 怀疑 这 
是 否 是 可 能 的 最 好 界限 。 事 实 上 ， 这 个 常数 在 最 坏 的 情况 下 (如 M 和 NN 是 两 个 相 邻 的 斐 波 
那 契 数 时 就 是 这 种 情况 ) 还 可 以 稍微 改进 成 1. 44 log N。 欧 几 里 得 算法 在 平均 情况 下 的 性 能 
需要 大 量 篇 幅 的 高 度 复杂 的 数学 分 析 ， 其 迭代 的 平均 次 数 约 为 (12 In 2 In N)/x 十 1.47。 


wise 

A15 85 Bc Je — ^P [0 T Ja b PE — ^p CS RE CE VR Je — T RERO. oh Uis TE f$ 80 D C — 
般 都 是 相当 大 的 ， 因 此 ， 我 们 只 能 在 假设 有 一 台 机 器 能 够 存储 这 样 一 些 大 整数 (或 有 一 个 编 
译 程序 能 够 模拟 它 ) 的 情况 下 进行 分 析 。 我 们 将 用 乘法 的 次 数 作为 运行 时 间 的 度量 。 

计算 X" 的 常见 算法 是 使 用 NN 一 1 次 乘法 自 乘 。 图 2-11 中 的 递归 算法 更 好 。 第 1 一 4 fT 
处 理 基准 情形 。 如 果 N 是 偶数 ， 则 XN = X e X 7. 如 果 N 是 奇数 ， 则 X" = XN VE - 
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XOCDA X, 
例如 ， 为 了 计算 X”， 算 法 将 如 下 进 
行 long int 
行 ， 它 只 用 到 9 次 乘法 : Pow( long int X, unsigned in N ) 
AO OM INN = CRT Aa /* 1*/ if( N 20) 
X5— (X! X,X" = (X"»!X, ^to MER d 
Ae OP "EU ifC IsEvenC N ) ) 
BR, RMB WMEKRESB 2log N, | C Qu Tetum PosCX IX N £28 
因为 把 问题 对 分 最 多 需要 两 次 乘法 (如 果 | 7 77 y ei ia 
N 是 奇数 )。 同 样 ， 这 里 可 以 使 用 递归 公 
趟 来 求解 该 问题 wl, fay AY FL oe mee oA H 图 2-11 BMRB 
的 强行 处 理 。 


有 了 时候 看 一 看 程序 能 够 进行 多 大 的 调整 而 不 影响 其 正确 性 是 很 有 意思 的 。 在 图 2-11 
中 ,第 3 和 4 行 实际 上 不 是 必需 的 ， 因 为 如 果 N 是 1. 那么 第 7 行将 做 同样 的 事情 。 第 7 
行 还 可 以 写成 


yn Sy return Pow(X,N-1)* X; 


而 不 影响 程序 的 正确 性 。 事 实 上 ， 程 序 仍 将 以 O(log N) 运 行 ， 因 为 乘法 的 序列 同 以 前 一 
FÉ. be 下 面 所 有 对 第 6 行 的 修改 都 是 不 可 取 的 ,虽然 它们 看 起 来 似乎 都 正确 : 


人 return Pow( Pow( X,2),N/2); 
PP 26D Ex return Pow( Pow(X,N/2),2); 
Le Bp o) return Pow(X,N/2 )* Pow(X,N/2); 


6a 和 6b 两 行 都 是 不 正确 的 ， 因 为 当 N 是 2 的 时 候 Pow 中 有 一 个 递归 调用 以 2 作为 第 
二 个 参数 。 这 样 ， 程 序 产生 一 个 无 限 循 环 ， 将 不 能 往 下 进行 (最 终 导致 程序 崩溃 ) 。 

使 用 6c 行 会 影响 程序 的 效率 ， 因 为 此 时 有 两 个 大 小 为 N72 的 递归 调用 而 不 是 一 个 。 分 
析 指 出 ， 其 运行 时 间 不 再 是 O(log N) 。 我 们 把 确定 新 的 EAE. 


2.4.5 检验 你 的 分 析 


一 旦 完成 分 析 ， 则 需要 看 一 看 答案 是 否 正确 ， 是 否 是 最 优 的 。 一 种 实现 方法 是 编程 并 
比较 实际 观察 到 的 运行 时 间 与 通过 分 析 所 描述 的 运行 时 间 是 否 相 匹配 。 当 N 扩大 一 倍 时 ， 
线性 程序 的 运行 时 间 乘 以 因子 2， 二 次 程序 的 运行 时 间 乘 以 因子 4， 而 三 次 程序 的 运行 时 间 
则 乘 以 因子 8。 以 对 数 时 间 运 行 的 程序 当 增加 一 倍 时 其 运行 时 间 只 是 多 加 一 个 常数 ， 而 
以 O(N log N) 运 行 的 程序 则 花费 比 相同 环境 下 运行 时 间 的 两 倍 稍 多 一 些 的 时 间 。 如 果 低 阶 
项 的 系数 相对 较 大 , 但 N 又 不 够 大 ， 那 么 运行 时 间 的 变化 量 很 难 观 察 清 楚 。 例 如 ， 对 于 最 
大 子 序 列 和 问题 ， 当 从 N= 10 增 到 N= 100 BE. 运行 时 间 的 变化 就 是 一 个 例子 。 单 纯 赁 实 
践 区 分 线性 程序 和 O(N log N) 程 序 是 非常 困难 的 。 
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验证 一 个 程序 是 否 是 O(f(N)) 的 男 一 个 常用 技巧 是 对 N 的 某 个 范围 (通常 用 2 的 倍数 
隔 开 ) 计 算 比值 TCN)/f(N)， 其 中 TC(N) 是 途经 验 观 察 到 的 运行 时 间 。 如 果 AN) 是 运行 时 
间 的 理想 近似 ， 那 么 所 算出 的 值 收 敛 于 一 个 正常 数 。 如 果 fA(N) 佑 计 过 大 ， 则 算出 的 值 收 敛 
于 0。 如 果 A(CN) 佑 计 过 低 从 而 程序 不 是 OC PON) I, 那么 算出 的 值 发散 。 

举例 来 说 ， 图 2-12 D EE 先 取 并 小 于 或 等 于 N 的 互 异 正 整数 互 素 的 
概率 。( 当 NN 增 大 时 ， 结 果 将 趋 于 6/r 





Rel = 0; Tot = 0; 
for( i = 1; i <= N; i++ ) 
forC j = ï +1; j <= N; j++ ) 
{ 
Tot++; 
ifC Ged¢ d, j 2 == 1) 
Rel++; 


} 
printf( "Percentage of relatively prime pairs is %f\n", 
( double ) Rel / Tot ); 








图 2-12 估计 两 个 随机 数 互 素 的 概率 
读者 应 该 能 够 立即 对 这 个 程序 做 出 











N CPU 时 间 ](7) TIN’ TIN? T/N? log N ] 
o 2- 1 3 H e < lj [H^ ix 
分 析 。 图 显示 实际 观察 到 的 该 例 程 100 022 | 0.002200 | 0.000 022 000 | 0.0 004 777 
在 一 台 具 体 的 计算 机 上 的 运行 时 间 。 如 200 056 | 0.001400 | 0.000 007 000 | 0.0 002 642 


300 118 0.001 311 | 0.000 004 370 f 0.0 002 299 


图 所 示 ， 最 后 一 列 是 最 有 可 能 的 ， 因 此 400 207 | 0.001 294 | 0.000 003 234 | 0.0002 159 
所 得 出 的 这 个 分 析 很 可 能 正确 。 注意 500 318 | 0.001 272 | 0.000 002 544 | 0.0 002 047 





























- - 
Y N? 2 ^ > 600 466 | 0.001294 | 0.000 002 157 | 0.0002 024 
f£ OCN') RI OCN? log NN) 之 间 没 有 多 大 700 644 0.001 314 | 0.000 001 877 | 0.0 002 006 
差别 ， 因 为 对 数 增长 得 很 慢 。 800 846 — | 0.001 322 | 0.000 001 652 | 0.0 001 977 
900 1 086 0.001 341 | 0.000 001 490 | 0.0 001 971 
1 000 1362 | 0.001 362 | 0.000 001 362 | 0.0001 972 
2.4.6 分 析 结 果 的 准确 性 1500 3240 | 0.001440 | 0.000 000 960 | 0.0 001 969 
2 000 5949 | 0.001 482 | 0.000 000 740 | 0.0 001 947 || 
经 验 指 出 ， 有 时 分 析 会 估计 过 大 。 4 000 25 720 0.001 608 | 0.000 000 402 | 0.0 001 938 || 














如 果 这 种 情况 发 生 ， 那 么 或 者 需要 分 析 得 

更 细 ( 一 般 通过 机 人 敏 的 观察 )， 或 者 可 能 是 

平均 运行 时 间 显著 小 于 最 坏 情形 的 运行 时 间 而 又 不 可 能 对 所 得 的 界 再 加 以 改进 。 对 于 许多 复 
杂 的 算法 ,最 坏 的 界 通过 某 个 不 良 输入 是 可 以 达到 的 , 但 在 实践 中 它 通常 是 估计 过 大 的 。 遗 
憾 的 是 ， 对 于 大 多 数 这 种 问题 ,平均 情形 的 分 析 是 极其 复杂 的 (在 许多 情形 下 还 是 未 解决 的 )， 
而 最 坏 情 形 的 界 尽管 有 些 过 分 悲观 但 却 是 最 好 的 已 知 解析 结果 。 


图 2-13 对 上 述 例 程 的 经 验 运行 时 间 


Q 总 结 


本 章 对 如 何 分 析 程 序 的 复杂 + 遗憾 的 是 ， 它 并 不 是 完善 的 分 析 指 南 。 
简单 的 程序 通常 给 出 简单 的 分 析 ， 但 是 情况 也 并 不 总 是 如 此 。 例 如 ， 在 本 书 稍 后 我 们 将 看 
到 一 个 排序 算法 ( 希 尔 排序 ， uw. 个 保持 不 相交 集 的 算法 (第 8 章 )， 它 们 大 约 都 需 
要 20 行程 序 代码 。 和 希 尔 排序 (Shellsort) 的 分 析 仍 然 不 完善 ， 而 不 相交 集 算法 的 分 析 非 常 困 
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难 ， 需 要 许多 错综复杂 的 计算 。 不 过 ， 我 们 在 这 里 遇 到 的 大 部 分 分 析 都 是 简单 的 ， 它 们 涉 
及 对 循环 的 计数 。 

一 类 有 趣 的 分 析 是 下 界 分 析 ， 我 们 尚未 接触 到 。 在 第 7 章 我 们 将 看 到 这 方面 的 一 个 例 
子 : 证 明 任 何 仅 通过 比较 来 进行 排序 的 算法 在 最 坏 情形 下 只 需要 Q(N log N) 次 比较 。 下 办 
的 证 明 一 般 是 最 困难 的 ， 因 为 它们 不 只 适用 于 求解 某 个 问题 的 一 个 算法 ， 而 是 适用 于 求解 
该 问题 的 一 类 算法 。 

在 本 章 结束 前 ， 我 们 指出 此 处 描述 的 某 些 算 法 在 实际 生活 中 的 应 用 。Gced 算法 和 求 贿 
算法 应 用 在 密码 学 中 。 特 别 是 ，200 位 的 数字 自 乘 至 一 个 大 的 震 次 (通常 为 另 一 个 200 位 的 
数 ) 。 而 在 每 乘 一 次 后 只 有 低 于 200 位 左右 的 数字 保留 下 来 。 由 于 这 种 计算 需要 处 理 200 位 
的 数字 ， 因 此 效率 显然 是 非常 重要 的 。 求 暴 运 算 的 直接 相 乘 会 需要 大 约 10” 次 乘法 ， 而 上 
面 描述 的 算法 只 需要 大 约 1 200 次 乘法 。 











Q 练习 


2.1 按 增 长 率 排 列 下 列 函 数 : N, VN, N^, N, N log N, N log log N, N log’ N, 
N log(N*), 2/N, 2%, 2%”, 37, N? log N， 玫 。 指 出 哪些 函数 以 相同 的 增长 率 增长 。 
2.2 设 TI(N)=O(f(N)) 和 Ts(N) 二 O(f(N))。 下 列 等 式 哪些 成 立 ? 
a. T,(N)+T.(N)=O(f(N)) 
b. T:(N)—T:(N)=o( f(N)) 


Ti CN) 
T;(N) 


d. Ti(N) SO(T; (N)) 
2.8 ”哪个 函数 增长 得 更 快 ? N log N, N''* P N(e0), 
2.4 ”证 明 对 任意 常数 &，log*N 二 ol(NN)。 
2.5 求 两 个 函数 f(N) 和 g(N), 使 得 f(N) 关 Ol(g(N)) 且 g(N) 隆 O(f(N))。 
2.6 对 于 下 列 6 个 程序 片段 中 的 每 一 个 : 
a. 给 出 运行 时 间 分 析 ( 使 用 大 O)。 
b. 用 你 选择 的 程序 语言 编程 ， 并 对 ON 的 若干 具体 值 给 出 运行 时 间 。 
c， 用 实际 的 运行 时 间 与 你 所 做 的 分 析 进 行 比 较 。 





e: =O(1) 


(1) Sum = 0; 
for( i = 0; i < N; i++ ) 
Sum++; 


(2) Sum = 0; 
for( i = 0; i <N; i++ ) 
for( j = 0; j < N; j++ ) 
Sum++; 


(3) Sum = 0; 
for( i = 0; i < N; i++ ) 
for( j = 0; j < N * Nj; j++ D 
Sum++; 
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2. 4 


2.8 


2.9 


(4) Sum = 0; 
for( i = 0; i < N; i++ ) 
for( j = 0; j «d; j++ ) 
Sum++; 
Sum = 0; 
for( i = 0; i < N; i++ ) 
forC 3.9 0; 1 «31 ie) 
for( k = 0; k < j; k++ ) 
Sum++; 


(5 


(6) Sum = 0; 
for( i = 1; i « N; i++ ) 
TONG = 1 je T ii je) 
EO joi 0) 
torG. k= 0; k <=}; ker) 
Sum++; 


假设 需要 生成 前 N 个 自然 数 的 一 个 随机 置换 。 例 如 ，!14，3，1，5，21 和 13，1，4， 

2，51 就 是 合法 的 置换 ,但 15，4，1，2，11 却 不 是 ， 因 为 数 1 出 现 两 次 却 没有 数 3。 

这 个 程序 常常 用 于 模拟 一 些 算法 。 我 们 假设 存在 一 个 随机 数 生成 器 RandInt(, j), 

它 以 相同 的 概率 生成 i 和 j 之 间 的 一 个 整数 。 下 面 是 三 个 算法 。 

1. 如 下 填 和 人 从 A[0] 到 ALN 一 1] 的 数组 A: 为 了 填 人 A[i]， 生 成 随机 数 直 到 它 不 同 于 
已 经 生成 的 A[0]，AL1]，…，AL[Li 一 1] 时 ,再 将 其 填 人 A[i]。 

. 同 算法 1, 但 是 要 保存 一 个 附加 的 数组 ， 称 之 为 Used( 用 过 的 ) 数 组 。 当 一 个 随机 
数 Ran 最 初 被 放 人 数组 4 的 时 候 ， 置 Used[ Ran] 王 1。 这 就 是 说 ， 当 用 僵 个 随机 
数 填 人 AL 时， 可 以 用 一 步 来 测试 是 否 该 随机 数 已 经 被 使 用 ， 而 不 是 像 第 一 个 算 
法 那样 (可 能 ) 进 行 i 步 测试 。 

3. 填写 该 数组 使 得 A[] i1. AXI: 


bdo 


for (i= 1;i<N;i++) 


Swap (&A[i]&A[Randrint (0.i )]); 


a. 证 明 这 三 个 算法 都 生成 合法 的 置换 ， 并 且 所 有 的 置换 都 是 等 可 能 的 。 

b. 对 每 一 个 算法 给 出 你 能 够 得 到 的 尽 可 能 准确 的 期 望 的 运行 时 间 分 析 ( 用 大 O)。 

c. 分 别 写 出 程序 来 执行 每 个 算法 10 次 ， 得 出 一 个 好 的 平均 值 。 对 N=250, 500, 
1000, 2000 运行 程序 1; 对 N=2500, 5000, 10000, 20000, 40000, 80000 
运行 程序 2; 对 N=10 000, 20000, 40000, 80000, 160000, 320000, 640 000 
运行 程序 3。 

.将 实际 的 运行 时 间 与 你 的 分 析 进 行 比较 。 

e. 每 个 算法 在 最 坏 情形 下 的 运行 时 间 是 什么 ? 

用 运行 时 间 的 估计 值 完成 图 2-2 中 的 表 ， 当 时 这 些 估计 值 太 长 无 法 模拟 。 加 入 这 些 算法 

的 运行 时 间 并 估计 计算 100 万 个 数 的 最 大 子 序列 和 所 需要 的 时 间 。 你 得 出 哪些 假设 ? 


a 


WE F(X) = DAX 需要 多 少时 间 ? 
a。 用 简单 的 程序 执行 取 宕 运算 。 


* 2. 


A JS qw N 


. 10 


14 
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b. 使 用 2. 4. 4 节 的 例 程 计算 。 
考虑 下 述 算法 ( 称 为 Horner 法 则 )。 计 算 F(X) = DAX 的 值 : 


Poly = 0; 
for( i = N; i >= 0; i-- ) 
Poly = X * Poly + ALi]; 
a. 对 X= 二 3，F(X) 二 4X' 十 8X 十 X 十 2 指出 该 算法 的 各 步 是 如 何 进行 的 。 
b. 解释 该 算法 为 什么 能 够 解决 这 个 问题 。 
c. 该 算法 的 运行 时 间 是 多 少 ? 
给 出 一 个 有 效 的 算法 来 确定 在 整数 A, <A, A. << Ay 的 数组 中 是 否 存 在 整数 i 
使 得 A; 二 i。 你 的 算法 的 运行 时 间 是 多 少 ? 
给 出 有 效 的 算法 (及 其 运行 时 间 分 析 ) : 
a. 求 最 小 子 序列 和 。 


x b. 求 最 小 的 正 子 序列 和 。 
* c， 求 最 大 子 序列 乘积 。 


a. 编写 一 个 程序 来 确定 正 整 数 N 是 否 是 素数 。 

b. 你 的 程序 在 最 坏 情 形 下 的 运行 时 间 是 多 少 (用 N 表示 )? (你 应 该 能 够 写 出 O(VN) 
的 算法 程序 。) 

c 令 B 等 于 NN 的 二 进 制 表示 法 中 的 位 数 。B 的 值 是 多 少 ? 

d. 你 的 程序 在 最 坏 情 形 下 的 运行 时 间 是 什么 (用 B 表示 )? 

e. 比较 确定 一 个 20( 二 进 制 ) 位 的 数 是 否 是 素数 和 确定 一 个 40( 二 进 制 ) 位 的 数 是 否 是 
素数 的 运行 时 间 。 

f. 用 NN 或 B 给 出 运行 时 间 更 合理 吗 ? 为 什么 ? 

Erastothenes 筛 是 一 种 用 于 计算 小 于 N 的 所 有 素数 的 方法 。 我 们 从 制作 整数 2 到 N 

的 表 开 始 。 我 们 找 出 最 小 的 未 被 删除 的 整数 i， 打印 i， 然 后 删除 i，2i，3i，…。 当 

i>VN 时 ， 算 法 终止 。 该 算法 的 运行 时 间 是 多 少 ? 

证 明 X” aJ ARH 8 次 乘法 算出 。 

不 用 递归 ， 写 出 快速 求 暴 的 程序 。 

给 出 用 于 快速 取 窜 运算 中 的 乘法 次 数 的 精确 计数 。( 提 示 : BREN 的 二 进 制 表示 。) 

经 分 析 发 现 程 序 A 和 B 的 最 坏 情形 运行 时 间 分 别 不 大 于 150N log; N MN’, WR 

能 ， 请 回答 下 列 问题 : 

a. N 值 很 大 时 (N>10 000)， 哪 一 个 程序 的 运行 时 间 有 更 好 的 保障 ? 

b. N 值 很 小 时 (CN<100) ， 哪 一 个 程序 的 运行 时 间 更 少 ? 

c. 对 于 N=1000， 哪 一 个 程序 平均 运行 得 更 快 ? 

d. 对 于 所 有 可 能 的 输入 ,程序 B 是 否 总 能 比 程序 A 运行 得 更 快 ? 

大 小 为 N 的 数组 A ， 其 主要 元 素 是 一 个 出 现 次 数 超过 N /2 的 元 素 ( 从 而 这 样 的 元 素 

最 多 有 一 个 )。 例 如 ， 数 组 
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,Re E.: 
有 一 个 主要 元 素 4， 而 数组 
AN N NO ee E. 
没有 主要 元 素 。 如 果 没 有 主要 元 素 ， 那 么 你 的 程序 应 该 指出 来 。 下 面 是 求解 该 问题 
的 一 个 算法 的 概要 : 

首先 ， 找 出 主要 元 素 的 一 个 候选 元 (这 是 难点 )。 这 个 候选 元 是 唯一 有 可 能 是 主 
要 元 素 的 元 素 。 第 二 步 确 定 该 候选 元 实际 上 是 否 就 是 主要 元 素 。 这 正好 是 对 数组 的 
顺序 搜索 。 为 找 出 数组 A 的 一 个 候选 元 ， 构 造 第 二 个 数组 B, WE A, 和 A,。 如 果 
它们 相等 ， 则 取 其 中 之 一 加 到 数组 B 中 ; 否则 什么 也 不 做 。 然 后 比较 A 和 A,， 同 
样 ， 如 果 它 们 相等 ， 则 取 其 中 之 一 加 到 BP, 否则 什么 也 不 做 。 以 该 方式 继续 下 去 
直到 读 完 整个 数组 。 然 后 ， 递 归 地 寻找 数组 B 中 的 候选 元 ， 它 也 是 A 的 候选 元 。 





(At A) 
a. 递归 如 何 终止 ? 
*b. 当 六 是 奇数 时 ， 如 何 处 理 ? 
ze 该 算法 的 运行 时 间 是 多 少 ? 
d. 如 何 避 免 使 用 附加 数组 B? 
xe. 编写 一 个 程序 求解 主要 元 素 。 , 
x2.20 为 什么 在 我 们 的 计算 机 模型 中 假设 整数 具有 固定 长 度 是 重要 的 ? 
2.21 考虑 第 1 章 中 描述 的 字谜 游戏 问题 。 假 设 我 们 将 最 长 单词 的 大 小 固定 为 10 个 字母 。 
a. R, CAW 分 别 表示 字迹 游戏 中 的 行 数 、 列 数 和 单词 个 数 ， 那 么 在 第 1 章 所 描 
述 的 算法 用 R、C 和 W 表示 的 运行 时 间 是 多 少 ? 
b. 设 单词 表 是 预先 排序 过 的 。 指 出 如 何 使 用 对 分 查找 得 到 一 个 运行 时 间 少 得 多 
的 算法 。 
2.22 假设 在 对 分 查找 程序 的 第 5 行 的 语句 是 Lows Mid 而 不 是 Low= Mid+ 1。 这 个 程序 
还 能 正确 运行 吗 ? 
2.23 ”实现 对 分 查找 使 得 在 每 次 迭代 中 只 有 一 个 二 路 比较 。 
2.24 设 算法 3( 图 2-7) 的 第 6 行 和 第 7 行 由 
/* 6*/ MaxLeftSum = MaxSubSum( A, Left, Center - 1 ); 
/* 7*/ | MaxRightSum = MaxSubSum( A, Center, Right ); 
代替 ,这 个 程序 还 能 正确 运行 吗 ? 
*2.25 立方 最 大 子 序列 和 算法 的 内 循环 执行 N(N 十 1)(N 十 2) /6 次 最 内 层 代 码 的 迭代 。 相 
应 的 二 次 算法 执行 N(N 十 1) /2 次 迭代 。 而 线性 算法 执行 N 次 迭代 。 哪 种 模式 是 一 
目 了 然 的 ?你 能 给 出 这 种 现象 的 组 合 学 解释 吗 ? 
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本 章 讨论 最 简单 和 最 基本 的 三 种 数据 结构 。 实 际 上 ,每 一 个 有 意义 的 程序 都 将 至 少 明确 
使 用 一 种 这 样 的 数据 结构 ,而 栈 则 在 程序 中 总 是 隐 含 使 用 ,不 管 你 在 程序 中 是 否 做 了 声明 。 

在 这 一 章 ,我 们 将 : 

e 介绍 抽象 数据 类 型 (ADT) 的 概念 。 

e 阐述 如 何 对 表 进 行 有 效 的 操作 。 

e 介绍 栈 ADT 及 其 在 实现 递归 方面 的 应 用 。 

e 介绍 队列 ADT 及 其 在 操作 系统 和 算法 设计 中 的 应 用 。 

因为 这 些 数据 结构 非常 重要 ,所 以 有 人 可 能 会 以 为 它们 很 难 实现 。 事 实 上 ,它们 极 容 易 
编程 ,主要 的 困难 是 要 做 足够 的 训练 ,以 便 写 出 一 般 只 有 几 行 大 小 的 好 的 通用 例 程 。 


3.1 抽象 数据 类 型 


程序 设计 的 基本 法 则 之 一 是 例 程 不 应 超过 一 页 。 这 可 以 通过 把 程序 分 割 为 一 些 模块 
(module) 来 实现 。 每 个 模块 是 一 个 逻辑 单位 并 执行 某 个 特定 的 任务 , 它 通 过 调用 其 他 模块 而 
使 本 身 保持 很 小 。 模 块 化 有 几 个 优点 。 第 一 ,调试 小 程序 比 调试 大 程序 要 容易 得 多 。 第 二 ， 
多 个 人 同时 对 一 个 模块 化 程序 编程 要 更 容易 。 第 三 ,一 个 写 得 好 的 模块 化 程序 把 某 些 依赖 关 
系 只 局 限 在 一 个 例 程 中 ,这 样 使 得 修改 起 来 更 容易 。 例 如 ,需要 以 某 种 格式 编写 输出 ,那么 重 
要 的 当然 是 让 一 个 例 程 去 实现 它 。 如 果 打 印 语句 分 散在 程序 各 处 ,那么 修改 所 费 的 时 间 就 会 
明显 地 拖 长 。 全 局 变量 和 副作用 是 有 害 的 观念 也 正 是 出 于 模块 化 是 有 益 的 想法 。 

抽象 数据 类 型 (Abstract Data Type,ADT) 是 一 些 操作 的 集合 。 抽 象 数 据 类 型 是 数学 的 
抽象 ,在 ADT 的 定义 中 根本 没 涉及 如 何 实现 这 些 操作 。 这 可 以 看 作 模 块 化 设计 的 扩充 。 

例如 表 、 集 合 、 图 以 及 它们 的 操作 ,它们 都 可 以 看 作 抽 象 数 据 类 型 ,就 像 整 数 、 实 数 和 布尔 
量 是 数据 类 型 一 样 。 整 数 、 实 数 及 布尔 量 有 与 它们 相关 的 操作 ,而 抽象 数据 类 型 也 有 与 之 相 
关 的 操作 。 对 于 集合 ADT, 我 们 可 以 有 并 (union)、 交 (intersection)、 求 大 小 (size) 以 及 取 余 
(complement) 等 操作 。 或 者 ,我们 也 可 以 只 要 两 种 操作 一 一 并 和 查找 (find), 这 两 种 操作 又 
在 该 集合 上 定义 了 一 种 不 同 的 ADT, 

我 们 的 基本 的 想法 是 ,这 些 操作 的 实现 只 在 程序 中 编写 一 次 ,而 程序 中 任何 其 他 部 分 需 
要 在 该 ADT 上 运行 其 中 的 一 种 操作 ,都 可 以 通过 调用 适当 的 函数 来 进行 。 如 果 由 于 某 种 原 
因 需 要 改变 操作 的 细节 ,通过 只 修改 运行 这 些 ADT 操作 的 例 程 应 该 可 以 很 容易 实现 。 在 理 
想 的 情况 下 ,这 种 改变 对 于 程序 的 其 余部 分 通常 是 完全 透明 的 。 

对 于 每 种 ADT 并 不 存在 什么 法 则 来 告诉 我 们 必须 要 有 哪些 操作 ,这 是 一 个 设计 决策 。 
洪 误 处 理 和 关系 的 重组 (在 适当 的 地 方 ) 一 般 也 取决 于 程序 设计 者 。 我 们 在 本 章 中 将 要 讨论 
的 这 三 种 数据 结构 是 ADT 的 最 基本 的 例子 。 我 们 将 会 看 到 它们 中 的 每 一 种 是 如 何以 多 种 方 
法 实现 的 ,不 过 ,使 用 它们 的 程序 却 没 有 必要 知道 它们 是 如 何 正 确实 现 的 。 


3.2 表 ADT 


我 们 将 处 理 形 如 A ,A, Asset Ay 的 普通 表 。 这 个 表 的 大 小 是 N。 我 们 称 大 小 为 0 的 
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表 为 空 表 (empty list). 

对 于 除 空 表 外 的 任何 表 , 我 们 说 A 后 继 A; (或 继 A; 之 后 ) 并 称 Aca (i 二 N) 前 驱 
tt 定义 A, 的 前 驱 元 ,也 
不 定义 Ay 的 后 继 元 。 元 素 A, 在 表 中 的 位 置 为 i。 为 了 简单 起 见 ,我 们 在 讨论 中 将 假设 表 中 
的 元 素 是 整数 ,但 一 般 说 来 任意 的 复元 素 也 是 允许 的 。 

与 这 些 “ 定 义 ” 相 关 的 是 我 们 要 在 表 ADT 上 进行 的 操作 的 集合 。PrintList 和 
MakeEmpty 是 常用 的 操作 ， 其 功能 显而易见 ; Find 返回 关键 字 首 次 出 现 的 位 置 ; Insert 
和 Delete 一 般 是 从 表 的 某 个 位 置 插 入 和 删除 某 个 关键 字 ; 而 FindKth 则 返回 某 个 位 置 上 
(作为 参数 指定 ) 的 元 素 。 如 果 34，12，52，16，12 是 一 个 表 ， 则 Fina(52) 会 返回 3; 
Insert(X，3) 可 能 把 表 变 成 34，12，52，X，16，12( 如 果 在 给 定位 置 的 后 面 插 和 的话); 
而 Delete(52) 则 将 该 表 变 为 34，12，X，16，12。 

当然 ， 一 个 函数 的 功能 怎样 才 算 恰当 ， 完 全 要 由 程序 设计 员 来 确定 ， 就 像 对 特殊 情况 
的 处 理 那样 。( 例 如 ， 上 述 Find(1) 返 回 什么 ?) 我 们 还 可 以 添加 一 些 运算 ,比如 Next 和 
Previous， 它 们 会 取 一 个 位 置 作为 参数 并 分 别 返 回 其 后 继 元 和 前 驱 元 的 位 置 。 


3.2.1 表 的 简单 数组 实现 


对 表 的 所 有 操作 都 可 以 使 用 数组 来 实现 。 虽 然 数 组 是 动态 指定 的 ， 但 还 是 需要 对 表 的 
大 小 的 最 太 值 进行 估计 。 通 常 需要 估计 得 大 一 些 ， 而 这 会 浪费 大 量 的 空间 。 这 是 严重 的 局 
限 ， 特 别 是 在 存在 许多 未 知 大 小 的 表 的 情况 下 。 

数组 实现 使 得 PrintList Ml Fina 正如 所 预期 的 那样 以 线性 时 间 执行 ， 而 Findkth 则 花费 
常数 时 间 。 然 而 ， 插 人 和 删除 的 花费 是 昂贵 的 。 例 如 ， 在 位 置 0 的 插入 (这 实际 上 是 插入 一 个 新 
的 第 一 元 素 ) 首 先 需 要 将 整个 数组 后 移 一 个 位 置 以 空 出 空间 来 ， 而 删除 第 一 个 元 素 则 需要 将 表 中 
的 所 有 元 素 前 移 一 个 位 置 ， 因 此 这 两 种 操作 的 最 坏 情况 为 OON)。 平 均 来 看 ， 这 两 种 运算 都 需要 移 
动 表 中 一 半 的 元 素 ， 因 此 仍然 需要 线性 时 间 。 只 通过 N 次 相继 插入 来 建立 一 个 表 将 需要 二 次 时 间 。 

因为 插入 和 删除 的 运行 时 间 非 常 慢 并 且 表 的 大 小 还 必须 事先 已 知 ， 所 以 简单 数组 一 般 
不 用 来 实现 表 这 种 结构 。 


3.2.2 链表 
为 了 避免 插入 和 删除 的 线性 开销 ， 我 们 允许 表 可 以 不 连续 存储 ， 和 否则 表 的 部 分 或 全 部 
需要 整体 移动 。 图 3-1 表达 了 链表 (linked list) 的 一 般 想法 。 
Pel A TES 
图 3-1 一 个 链表 
链表 由 一 系列 不 必 在 内 存 中 相连 的 结构 组 成 。 每 一 个 结构 均 含 有 表 元 素 和 指向 包含 该 


元 素 后 继 元 的 结构 的 指针 。 我 们 称 之 为 Next 指针 。 最 aie Next 指针 指向 NULL; 
该 值 由 C 定义 并 且 不 能 与 其 他 指针 混淆 。ANSI C 规定 NULL JE. 
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我 们 回忆 一 下 ， 指 针 变 量 就 是 包含 存储 另外 某 个 数据 的 地 址 的 变量 。 因 此 ， 如 果 P 被 
声明 为 指向 一 个 结构 的 指针 ， 那 么 存储 在 P 中 的 值 就 被 解释 为 主 存 中 的 一 个 位 置 ， 在 该 位 
置 能 够 找到 一 个 结构 。 该 结构 的 一 个 域 可 以 通过 P->FieldName 访问 ,其 中 FieldName 是 
我 们 想 要 考察 的 域 的 名 字 。 图 3-2 指出 图 3-1 中 表 的 具体 表示 。 这 个 表 含 有 五 个 结构 ， 恰 好 
在 内 存 中 分 配给 它们 的 位 置 分 别 是 1 000、800、712、992 和 692。 第 一 个 结构 的 指针 含有 值 
800， 它 提供 了 第 二 个 结构 所 在 的 位 置 。 其 余 每 个 结构 也 都 有 一 个 指针 用 于 类 似 的 目的 。 当 
然 ， 为 了 访问 该 表 ， 我 们 需要 知道 在 哪里 能 够 找到 第 一 个 单元 。 指 针 变量 就 用 于 这 个 目的 。 
重要 的 是 要 记 住 ， 一 个 指针 就 是 一 个 数 。 本 章 其 余部 分 将 用 箭头 画 出 指针 以 便 直观 表述 。 











[ef CH GCA [5T 
j L 
1000 800 712 992 692 





久 3-2” 带 有 指针 具体 值 的 链表 


为 了 执行 PrintList(L) 或 Find(L，Key), 我 们 只 要 将 一 个 指针 传递 到 该 表 的 第 一 
个 元 素 ， 然 后 用 一 些 Next 指针 遍历 该 表 即 可 。 这 种 操作 显然 是 线性 时 间 的 ， 虽 然 这 个 常 
数 可 能 会 比 用 数组 实现 时 大 。FindKkth 操作 不 如 数组 实现 的 效率 高 ，FinaKth( 工 ，z) 操 作 
花费 OGD) 时 间 以 显 性 方式 遍历 链表 。 在 实践 中 这 个 界 是 保守 的 ， 因 为 调用 FindKth 常常 是 
以 ( 按 D HEFE MA X ETT. BM. FindKkth(L. 2), FindKth(L. 3), Findkth(L, NUR 
FindKth(L，6) 可 通过 对 表 的 一 次 扫描 同时 实现 。 i 

删除 命令 可 以 通过 修改 一 个 指针 来 实现 。 图 3-3 给 出 在 原 表 中 删除 第 三 个 元 素 的 结果 。 


PTH PA EH Ts 


图 3-3 从 链表 中 删除 


插入 命令 需要 使 用 一 次 malloc 调用 从 系统 中 得 到 一 个 新 单元 (后 面 将 详细 论述 ) 并 在 
此 后 执行 两 次 指针 调整 。 其 一 般 想 法 在 图 3-4 中 给 出 ， 其 中 的 虚线 表示 原来 的 指针 。 


HSEHSTH 
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图 3-4 向 链表 插入 


32.3 程序 设计 细节 


上 面 的 描述 实际 上 足以 使 每 一 部 分 都 能 正常 工作 ， 但 还 是 有 几 处 地 方 可 能 会 出 问题 。 
第 一 ， 并 不 存在 从 所 给 定义 出 发 在 表 的 起 始 端 插入 元 素 的 真正 显 性 的 方法 。 第 二 ， 从 表 的 
起 始 端 实行 删除 是 一 个 特殊 情况 ， 因 为 它 改变 了 表 的 起 始 端 ， 编 程 中 的 朴 忽 将 会 造成 表 的 
丢失 。 第 三 个 问题 涉及 一 般 的 删除 。 虽 然 上 述 指针 的 移动 很 简单 ， 但 是 删除 算法 要 求 我 们 
记 住 被 删除 元 素 前 面 的 表 元 。 
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事实 上 ， 稍 做 一 个 简单 的 变化 就 能 够 解决 上 述 三 个 问题 。 我 们 将 留 出 一 个 标志 节点 ， 有 时 
候 称 之 为 表 头 (header) 或 哑 节 点 (dummy node)。 这 是 一 种 惯例 ， 在 后 面 将 会 多 次 使 用 。 我 们 约 


定 ， 表 头 在 位 置 0 处 。 图 3-5 表示 一 个 带 有 表 头 的 链表 ， 它 表示 表 A, A, 


see, Aus 
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图 3-5 具有 表 头 的 链表 


为 避免 删除 操作 相关 的 一 些 问题 ， 
我 们 需要 编写 例 程 FindPrevious， 它 
将 返回 我 们 要 删除 的 表 元 的 前 驱 元 的 位 
置 。 如 果 我 们 使 用 表 头 ， 那 么 当 我 们 删 
除 表 的 第 一 个 元 素 时 ，FindPrevious 
将 返回 表 头 的 位 置 。 表 头 节点 的 使 用 多 
少 是 有 些 争议 的 。 一 些 人 认为 ,添加 假 
想 的 单元 只 是 为 了 避免 特殊 情形 ， 这 样 
的 理由 不 够 充足 ， 他 们 把 表 头 节点 的 使 
用 看 成 与 老式 的 随意 删改 没有 多 大 区 
别 。 不 过 即使 这 样 ， 我 们 还 是 在 这 里 使 
用 它 ， 这 完全 因为 它 使 我 们 能 够 表达 基 
本 的 指针 操作 且 又 不 致使 特殊 情形 的 代 
， 码 含混 不 清 。 除 此 之 外 ， 要 不 要 使 用 表 
头 则 是 属于 个 人 兴趣 的 问题 。 

例如 ,我 们 将 把 这 些 表 ADT 的 半 
数 例 程 编写 出 来 。 首 先 ， 在 图 3-6 中 给 
出 我 们 需要 的 声明 。 按 照 C 的 约定 ， 作 
为 类 型 的 List( 表 ) 和 Position( 位 置 ) 
以 及 函数 的 原型 都 列 在 所 谓 的 .h 头 文 
件 中 。 上 有 具体 的 Node( 节 点 ) 声 明 则 在 .c 
文件 中 。 

我 们 将 编写 的 第 一 个 函数 用 于 测试 
空 表 。 当 我 们 编写 涉及 指针 的 任意 数据 
结构 的 代码 时 ， 最 好 是 先 画 出 一 张 图 。 
图 3-7 就 表示 一 个 空 表 ， 按 照 这 个 图 ， 
很 容易 写 出 图 3-8 PAY PAR. 

下 一 个 函数 如 图 3-9 所 示 ， 它 测试 
当前 的 元 素 是 否 是 表 的 最 后 一 个 元 素 ， 
假设 这 个 元 素 是 存在 的 。 








#ifndef _List_H 


struct Node; 

typedef struct Node *PtrToNode; 
typedef PtrToNode List; 

typedef PtrToNode Position; 


List MakeEmpty( List L ); 

int IsEmpty( List L ); 

int IsLast( Position P, List L ); 

Position Find( ElementType X, List L ); 

void Delete( ElementType X, List L ); 

Position FindPrevious( ElementType X, List L ); 
void Insert( ElementType X, List L, Position P ); 
void DeleteList( List L ); 

Position Header( List L ); 

Position First( List L ); 

Position Advance( Position P ); 

ElementType Retrieve( Position P ); 


#endif y* .List-H */ 


/* Place in the implementation file */ 
struct Node 
{ 

ElementType Element; 

Position Next; 


h 





图 3-6 ”链表 的 类 型 声明 


eur |- 
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/* Return true if L is empty */ 


int 
IsEmpty( List L ) 
{ 


return L->Next == NULL; 





图 3-8 测试 一 个 链表 是 否 是 空 表 的 函数 
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/* Return true if P is the last position in list L */ 
/* Parameter L is unused in this implementation */ 


int 
IsLast( Position P, List L ) 


return P->Next == NULL; 











图 3-9 测试 当前 位 置 是 否 是 链表 的 末尾 的 函数 

我 们 要 写 的 下 一 个 例 程 是 Fina。Finad 在 图 3-10 中 示 出 ， 它 返回 某 个 元 素 在 表 中 的 位 

置 。 第 2 行 用 到 与 (gg&) 操 作 走 了 捷径 ， 即 如 果 与 运算 的 前 半 部 分 为 假 ， 那 么 结果 就 自动 为 
假 ， 而 后 半 部 分 则 不 再 执行 。 





/* Return Position of X in L; NULL if not found */ 


Position 
Find( ElementType X, List L ) 
{ 


Position P; 
j5 1*7 P = L->Next; 
/* 2*/ while( P != NULL && P->Element != X ) 
/* 3*/ P = P->Next; 
/* 4*/ return P; 
} , 








图 3-10 rina 例 程 


有 些 编程 人 员 发 现 递 归 地 编写 Fina 例 程 颇 有 吸引 力 ， 大 概 是 因为 这 样 可 能 避免 宛 长 
的 终止 条 件 。 后 面 将 看 到 ， 这 是 一 个 非常 糟糕 的 想法 ,我 们 要 不 惜 一 切 代价 避免 它 。 

第 四 个 例 程 是 删除 表 工 中 的 某 个 元 素 X。 我 们 需要 决定 : WR X 出 现 不 止 一 次 或 者 根本 就 
没有 ， 那 么 该 做 些 什么 ? 我 们 的 例 程 将 删除 第 一 次 出 现 的 X， 如 果 X 不 在 表 中 我 们 就 什么 也 不 
做 。 为 此 ,我们 通过 调用 FindPrevious 函数 找 出 含有 XX 的 表 元 的 前 驱 元 P。 实 现 删除 (De- 
lete) 例 程 的 程序 如 图 3-11 中 所 示 。FindPrevious 例 程 类 似 于 Find， 它 在 图 3-12 中 列 出 。 








/* Delete first occurrence of X from a list */ 
/* Assume use of a header node * 


void 
Delete( ElementType X, List L ) 
{ 


Position P, TmpCell; 
P = FindPrevious( X, L ); 


if( !IsLast( P, L ) ) /* Assumption of header use */ 

{ /* X is found; delete it */ 
TmpCell = P->Next; 
P->Next = TmpCell->Next; /* Bypass deleted cell */ 
free( TmpCell ); 











图 3-11 链表 的 删除 例 程 
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我 们 要 写 的 最 后 一 个 例 程 是 插入 (Insert ) 例 程 。 将 要 插入 的 元 素 与 表 工 和 位 置 P 一 
起 传人 。 这 个 Insert 例 程 将 一 个 元 素 插 到 由 P. 所 指示 的 位 置 之 后 。 这 个 决定 有 随意 性 ， 
它 意 味 着 插入 操作 如 何 实 现 并 没有 完全 确定 的 规则 。 很 有 可 能 将 新 元 素 插 入 位 置 P 处 ( 即 在 
位 置 己 处 当时 的 元 素 的 前 面 )， 但 是 这 么 做 则 需要 知道 位 置 己 前 面 的 元 素 。 它 可 以 通过 调 
用 FindPrevious 而 得 到 。 因 此 重要 的 是 要 说 明 你 要 干什么 。 图 3-13 完成 这 些 任 务 。 





/* If X is not found, then Next field of returned */ 
/* Position is NULL */ 
/* Assumes a header */ 


Position 
FindPrevious( ElementType X, List L ) 
{ 


Position P; 
/* 1*/ P= L; 
/* 2*/ while( P-»Next != NULL && P->Next->Element !- X ) 
[PSF P = P->Next; 
/* 4*/ return P; 











图 3-12 FindPrevious 与 Delete 一 起 使 用 的 Find 例 程 








/* Insert (after legal position P) */ 
/* Header implementation assumed */ 
/* Parameter L is unused in this implementation */ 


void 
Insert( ElementType X, List L, Position P ) 
{ 

Position TmpCell; 


y* PF TmpCell = malloc( sizeof( struct Node ) ); 
/* 2*/ if( TmpCell == NULL ) 

Le 354 FatalError( "Out of space!!!" ); 

/[* 4*/ TmpCell-»Element = X; 

/[* 5*7 TmpCell-»Next = P->Next; 

/* 6*/ P->Next = TmpCell; 











图 3-13 ”链表 的 插入 例 程 


注意 ,我 们 已 经 把 表 工 传递 给 Insert 例 程 和 IsLast 例 程 ， 尽 管 它 从 未 被 使 用 过 。 
之 所 以 这 么 做 ， 是 因为 别 的 实现 方法 可 能 会 需要 这 些 信 息 ， 因 此 ， 若 不 传递 表 工 有 可 能 使 
得 使 用 ADT 的 想法 失败 。” 

除 Find 和 FindPrevious 例 程 外 (还 有 例 程 Delete， 它 调用 FindPrevious)， 已 
经 编码 的 所 有 操作 均 需 O(1) 时 间 。 这 是 因为 在 所 有 的 情况 下 ， 不管 表 有 和 多大， 都 只 执行 固 
定数 目的 指令 。 对 于 例 程 Find 和 FindPrevious， 在 最 坏 的 情形 下 运行 时 间 是 O(N),， 因 
为 此 时 车 元 素 未 找到 或 位 于 表 的 末尾 则 可 能 遍历 整个 表 。 平均 来 看 ， 运 行 时 间 是 ON), WN 
为 必须 平均 扫描 半 个 表 。 





(D 
x 
m 
up 


法 的 ， 不 过 有 些 编译 器 会 发 出 警告 。 


4] 
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在 图 3-6 中 列 出 的 其 他 例 程 相 当 简 单 。 我 们 也 可 以 编写 一 个 例 程 来 实现 Previous. Br 
有 这 些 将 留 作 练习 。 


3.2.4 常见 的 错误 


最 常 遇 到 的 错误 是 你 的 程序 因 来 自 系 统 的 环 手 的 错误 信息 而 崩溃 ， 比 如 “memory ac- 
cess violation” 或 “segmentation violation”， 这 种 信息 通常 意味 着 有 指针 变量 包含 了 伪 地 
址 。 一 个 通常 的 原因 是 初始 化 变量 失败 。 





例如 ， 如 果 图 3-14 中 的 第 一 行 遗漏 ， 那 /* Incorrect DeleteList algorithm */ 
i rar Six xs id 
么 也 就 是 未 定义 的 ， 当 然 也 就 不 可 能 指 ep ut] 
{ 


向 内 存 的 有 效 部 分 。 另 一 个 典型 的 错误 是 
关于 图 3-13 的 第 6 行 。 WA P 是 NULL. ye 1*/ P = L->Next; /* Header assumed */ 
则 指向 是 非法 的 。 这 个 函数 知道 已 不 是 | 和 3 Leve M 


Position P; 


/* 3*/ while( P != NULL ) 
人 P YL { 

NULL， 所 以 例 程 没有 问题 。 当 然 ， 你 应 d adt Pubs Pons 

该 仔细 考虑 ， 使 得 调用 Insert 的 例 程 能 a Foe PNeXts 


} 





保证 这 一 点 。 无 论 何 时 只 要 确定 一 个 指 } 
向 ， 那 么 就 必须 保证 该 指针 不 是 NULL. 
Ay 9€ C 编译 器 隐 式 地 为 你 做 这 种 检查 ， 
不 过 这 并 不 是 C 标准 的 一 部 分 。 当 你 将 一 个 程序 从 一 个 编译 器 移 至 另 一 个 编译 器 时 ， 可 能 
发 现 它 不 再 正常 运行 。 这 就 是 这 种 错误 常见 的 原因 之 一 。 

第 二 种 错误 涉及 何 时 使 用 或 何 时 不 使 用 malloc 来 获取 一 个 新 的 单元 。 必 须 记 住 ， 声 明 
指向 一 个 结构 的 指针 并 不 创建 该 结构 ， 而 只 是 给 出 足够 的 空间 容纳 结构 可 能 会 使 用 的 地 址 。 
创建 尚未 被 声明 过 的 记录 的 唯一 方法 是 使 用 malloc J PAX. malloc (HowManyBytes) 奇迹 
般 地 使 系统 创建 一 个 新 的 结构 并 返回 指向 该 结构 的 指针 。 另 一 方面 ， 如 果 你 想 使 用 一 个 指 
针 变 量 沿 着 一 个 表 行 进 ， 那 就 没有 必要 创建 新 的 结构 ， 此 时 不 宜 使 用 malloc 命令 。 非 常 
老 的 编译 器 需要 一 个 类 型 转换 (type cast) 使 得 赋值 操作 符 两 边 相 符 。C 库 提供 了 malloc 的 
其 他 形式 ， 如 calloc。 这 两 个 例 程 都 要 求 包含 stalib.n 头 文件 。 

当 有 些 空间 不 再 需要 时 ， 你 可 以 用 free 命令 通知 系统 来 回收 它 。free(P) 的 结果 是 : 
P 正 在 指向 的 地 址 没 变 ， 但 在 该 地 址 处 的 数据 此 时 已 无 定义 了 。 

如 果 你 从 未 对 一 个 链表 进行 过 删除 操作 ， 那么 调用 malloc 的 次 数 应 该 等 于 表 的 大 小 ， 
若 有 表 头 则 再 加 1。 少 一 点 儿 你 就 不 可 能 得 到 一 个 正常 运行 的 程序 ; 多 一 点 儿 你 就 会 浪费 空 
间 并 可 能 要 浪费 时 间 。 偶 尔 会 出 现下 列 情 况 : 当 你 的 程序 使 用 大 量 空间 时 ， 系 统 可 能 不 能 
满足 你 对 新 单元 的 要 求 。 此 时 返回 的 是 NULL 指针 。 

在 链表 中 进行 一 次 删除 之 后 ， 再 将 该 单元 释放 通常 是 一 个 好 的 想法 ， 特 别 是 当 许 多 的 
插入 和 删除 操作 挫 杂 在 一 起 而 内 存 会 出 现 问题 的 时 候 。 对 于 要 被 释放 的 单元 ， 应 该 需要 一 
个 临时 的 变量 ， 因 为 在 撤除 指针 的 工作 结束 后 ， 你 将 不 能 再 引用 它 。 人 例如， 图 3-14 的 代码 
就 不 是 删除 整个 表 的 正确 的 方法 (虽然 在 有 些 系统 上 它 能 够 运行 )。 

图 3-15 显示 了 删除 表 的 正确 方法 。 处 理 闲 置 空间 的 工作 未 必 很 快 完成 ， 因 此 你 可 能 要 检 





图 3-14 删除 一 个 表 的 不 正确 的 方法 
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i pe re ee 


re de bd tii 


NU. 显然 会 引起 另 一 个 线性 程 
序 花费 OCN log Rind den 入 个 单元 。 

as malloc (sizeof (PtrToNode ) ) 
是 合法 的 ， 但 是 它 并 不 给 结构 体 分 配 足够 
的 空间 。 它 只 给 指针 分 配 空间 。 


3.2.5 WHER 


有 时 候 以 倒序 扫描 链表 很 方便 。 标 准 
实现 方法 此 时 无 能 为 力 ， 然 而 解决 方法 却 
很 简单 。 只 要 在 数据 结构 上 附加 一 个 域 ， 
使 它 包含 指向 前 一 个 单元 的 指针 即 可 。 其 


事实 上 ， 单 元 以 相当 特 











je wy 
j* 287 
fo BW 
/* an 
J* Sk 
/* 6*/ 


/* Correct DeleteList algorithm */ 


void 
Deletelist( List L ) 
{ 


Position P, Tmp; 


P = L->Next; /* Header assumed */ 
L->Next = NULL; 
while( P != NULL ) 


Tmp = P->Next; 
free( P ); 
P = Tmp; 
} 
} 





图 3-15 删除 表 的 正确 方法 


开销 是 一 个 附加 的 链 ， 它 增加 了 空间 的 需求 ， 同 时 也 使 得 插入 和 删除 的 开销 增加 一 倍 ， 因 为 


有 更 多 的 指针 需要 定位 。 


另外 ， 它 简化 了 删除 操作 ， 因 为 你 不 再 被 迫使 用 一 个 指向 前 驱 元 的 


指针 来 访问 一 个 关键 字 ， 这 个 信息 是 现成 的 。 图 3-16 表示 一 个 双 链 表 (doubly linked list) 。 
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图 3-16 一 个 双向 链表 


3.2.6 循环 链表 


让 最 后 的 单元 反 过 来 直 指 第 一 个 单元 是 一 种 流行 的 做 法 。 它 可 以 有 表 头 ， 也 可 以 没有 


表 头 ( 若 有 表 头 ， 
针 指 向 最 后 的 单元 ) 。 


则 最 后 的 单元 就 指向 它 )， 并 且 还 可 以 是 双向 链表 (第 一 个 单元 的 前 驱 元 指 
这 无 疑 会 影响 某 些 测试 ， 不 过 这 种 结构 在 某 些 应 用 程序 中 却 很 流行 。 
图 3-17 显示 了 一 个 无 表 头 的 双向 循环 链表 。 
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图 3-17 一 个 双向 循环 链表 
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我 们 提供 三 个 使 用 链表 的 例子 。 第 一 例 是 表示 一 元 多 项 式 的 简单 方法 。 第 二 例 是 在 某 
些 特 殊 情 况 下 以 线性 时 间 进 行 排序 的 一 种 方法 。 最 后 


了 链表 如 何 用 于 大 学 的 课程 注册 。 
多 项 式 ADT 


， 我 们 介绍 一 个 复杂 的 例子 ， 它 说 明 


我 们 可 以 用 表 来 定义 一 种 关于 一 元 (具有 非 负 震 ) 多 项 式 的 抽象 数据 类 型 。 令 F(X) = 


[51] 
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AA .如 果 大 部 分 系数 非 零 ,那么 我 们 可 以 用 一 个 简单 数组 来 存储 这 些 系 数 . 然 后 ,可 以 纺 


写 一 些 对 多 项 式 进 行 加 、 减 、 乘 、 微 分 及 其 他 操 
作 的 例 程 。 此 时 ， 我 们 可 以 使 用 在 图 3-18 中 给 出 s: 
的 类 型 声明 。 这 时 ， 我 们 就 可 编写 进行 各 种 不 同 ctei 

* lynomial; 
操作 的 例 程 了 ， 例 如 加 法 和 乘法 ， 它 们 在 图 3-19 |} temm 
到 图 3-21 中 列 出 。 忽 略 将 输出 多 项 式 初始 化 为 零 
的 时 间 ， 则 乘法 例 程 的 运行 时 间 与 两 个 输入 多 项 
式 的 次 数 的 乘积 成 正比 。 它 适合 大 部 分 项 都 有 的 void | 
ZeroPolynomial( Polynomial Poly ) 
puc. (A P,CXO—10X!'"" +5X" +1 { 
BP,CX) =3x' —2X'* --121X-5, BABA 

for( i = 0; i <= MaxDegree; i++ ) 
时 间 就 可 能 不 可 接受 了 。 可 以 看 出 ， 大 部 分 的 时 5 er i]=0; 
间 都 花 在 了 乘 以 0 和 单 步调 试 两 个 输入 多 项 式 中 | ) 人 noera 
大 量 不 存在 的 部 分 上 。 这 是 我 们 不 愿 看 到 的 。 
另 一 种 方法 是 使 用 单 链表 (singly linked list) 。 图 3-19 ”将 多 项 式 初 始 化 为 零 的 过 程 

多 项 式 的 每 一 项 含 在 一 个 单元 中 ， 并且 这 些 单元 以 次 数 递 减 的 顺序 排序 。 例 如 ， 图 3-22 中 
的 链表 表示 PiX) M P,(X)。 此 时 我 们 可 以 使 用 图 3-23 的 声明 。 





typedef struct 





图 3-18 ”多 项 式 ADT 的 数组 实现 的 类 型 声明 





ant 15 

















void 
AddPolynomial( const Polynomial Polyl, 

const Polynomial Poly2, Polynomial PolySum ) 
{ 


int i; 


ZeroPolynomial( PolySum ); 
PolySum->HighPower = Max( Polyl->HighPower, 
Poly2->HighPower ); 


for( i = PolySum->HighPower; i >= 0; i-- ) 
PolySum->CoeffArray[ i ] = Polyl-»CoeffArray[ i ] 
* Poly2-»CoeffArray[ i ]; 











图 3-20 ”两 个 多 项 式 相 加 的 过 程 





void 
MultPolynomial( const Polynomial Polyl, 

const Polynomial Poly2, Polynomial PolyProd ) 
{ 


int i, j; 


ZeroPolynomial( PolyProd ); 
PolyProd->HighPower = Polyl->HighPower + Poly2->HighPower; 


if( PolyProd->HighPower > MaxDegree ) 
Error( "Exceeded array size" ); 
else 
for( i = 0; i <= Polyl->HighPower; i++ ) 
for( j = 0; j <= Poly2->HighPower; j++ ) 
PolyProd-»CoeffArray[ i + j ] += 
Polyl-»CoeffArray[ i ] * 
Poly2-»CoeffArray[ j J; 











图 3-21 两 个 多 项 式 相 乘 的 过 程 
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图 3-22 两 个 多 项 式 的 链表 表示 
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typedef struct Node *PtrToNode; 
struct Node 

int Coefficient; 

int Exponent; 

PtrToNode Next; 
h 


typedef PtrToNode Polynomial; /* Nodes sorted by exponent */ 











图 3-23 ”多项式 ADT 链表 实现 的 类 型 声明 


上 述 操 作 将 很 容易 实现 。 唯 一 的 潜在 困难 在 于 ， 当 两 个 多 项 式 相 乘 的 时 候 所 得 到 的 多 
项 式 必 须 合 并 同类 项 。 这 可 以 有 多 种 方法 实现 ， 我 们 把 它 留 作 练习 。 


基数 排序 

使 用 链表 的 第 二 个 例子 叫 作 基数 排序 (radix sort)。 基 数 排序 有 时 也 称 为 卡 式 排序 (card 
sort) ， 因 为 直到 现代 计算 机 出 现 之 前 ， 它 一 直 用 于 对 老式 穿孔 卡 的 排序 。 

如 果 我 们 有 NN 个 整数 ， 范 围 从 1 到 M( 或 从 0 到 M 一 1)， 我 们 可 以 利用 这 个 信息 得 到 
一 种 快速 的 排序 ， 叫 作 桶 式 排 序 (bucket sort) 。 我 们 留置 一 个 数组 ， 称 之 为 Count， 大 小 为 
M， 并 初始 化 为 零 。 于 是 ，Count 有 M 个 单元 (或 桶 )， 开 始 时 它们 都 是 空 的 。 当 A, 被 读 入 
时 Count[LA;] 增 1。 在 读 和 人 所 有 的 输入 以 后 ,扫描 数 组 Count， 打 印 输出 排 好 序 的 表 。 该 算 
法 花费 OCM 十 N)， 其 证 明 留 作 练 习 。 如 果 M 二 BCN)， 则 桶 式 排序 为 OCN) 。 

基数 排序 是 这 种 方法 的 推广 。 要 了 解 方法 的 含义 ， 最 容易 的 方式 就 是 举例 说 明 。 设 我 
们 有 10 个 数 ， 范 围 在 0 到 999 之 间 ， 我们 将 其 排序 。 一 般 说 来 ， 这 是 0 到 N’ 一 1 间 的 NN 
个 数 ，p 是 某 个 常数 。 显 然 ， 我 们 不 能 使 用 桶 式 排 序 ， 那 样 桶 就 太 多 了 。 我 们 的 策略 是 使 
用 多 趟 桶 式 排序 。 自 然 的 算法 就 是 通过 最 高 (有 效 )“ 位 ”( 对 基数 N 所 取 的 位 ) 进 行 桶 式 排 
序 ， 然 后 是 对 次 最 高 (有 效 ) 位 进行 桶 式 排 序 ， 等 等 。 这 种 算法 不 能 得 出 正确 结果 ， 但 是 ， 
如 果 我 们 用 最 低 ( 有 效 )“ 位 ”优先 的 方式 进行 桶 式 排 序 ， 那 么 算法 将 得 到 正确 结果 。 当 然 ， 
有 可 能 多 于 一 个 数落 入 相同 的 桶 中 ， 但 有 别 于 原始 的 桶 式 排 序 ， 这 些 数 可 能 不 同 ， 因 此 我 
们 把 它们 放 到 一 个 表 中 。 注 意 ， 所 有 的 数 可 能 都 有 某 位 数字 ， 因 此 如 果 使 用 简单 数组 表示 
表 ， 那 么 每 个 数组 必然 大 小 为 N， 总 的 空间 需求 是 BCN: ) 。 

下 面 的 例子 说 明 10 个 数 的 桶 式 排序 的 具体 做 法 。 本 例 的 输入 是 64，8，216，512，27， 
729，0，1，343，125(10 个 三 位 数 ， 随 机 排列 ) 。 第 一 步 按照 最 低位 优先 进行 桶 式 排 序 。 为 
使 问题 简化 ， 此 时 操作 按 基 是 10 进行 ， 不 过 一 般 并 不 做 这 样 的 假设 。 图 3-24 显示 出 这 些 桶 
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的 位 置 ， 因 此 按 最 低位 优先 排序 得 到 的 表 是 0， 


现在 再 按照 次 最 低位 ( 即 十 位 上 的 数 
字 ) 优 先进 行 第 二 趟 排序 ( 见 图 3-25). 
第 二 趟 排序 输出 0，1，8，512，216， 
125，27，729，343，64。 现 在 这 个 表 
是 按 两 个 最 小 的 位 排序 得 到 的 表 。 最 
后 一 趟 桶 式 排 序 是 按 最 高 位 进行 ， 其 
结果 如 图 3-26 所 示 。 最 后 得 到 的 表 是 
9 
518, 729, 

为 使 算法 能 够 得 出 正确 的 结果 ， 要 
注意 唯一 出 错 的 可 能 是 如 果 两 个 数 出 自 
同一 个 桶 但 顺序 却 是 错误 的 。 不 过 ， 前 
面 各 趟 排序 保证 了 当 几 个 数 进 入 一 个 桶 
的 时 候 ， 它 们 是 以 排序 的 顺序 进入 的 。 
该 排序 的 运行 时 间 是 O(P(N 十 B))， 
Hop P 是 排序 的 趋 数 ，N 是 要 被 排序 


| 


1, 512, 343, 64, 125, 216, 27, 8, 729, 
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图 3-24 第 一 趟 基数 排序 后 的 桶 
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的 元 素 的 个 数 ， 而 B 是 桶 数 。 本 例 中 ，B= NN。 

举 一 个 例子 ， 我们 可 以 把 能 够 在 (32 位 ) 计 算 机 上 表示 的 所 有 整数 按 基数 排序 方法 排序 ， 
假设 我 们 在 大 小 为 2" 的 桶 的 条 件 下 分 三 趟 进行。 在 这 人 台 计 算 机 上 ， 该 算法 将 总 是 O(N) 的 ， 
但 是 ， 因 为 包含 大 的 常数 ， 有 可 能 仍然 不 如 我 们 将 在 第 7 章 看 到 的 某 些 算法 有 效 。( 注 意 ， 
log N 的 因子 并 非 都 这 么 大 ， 而 该 算法 总 有 维持 链表 的 附加 开销 。) 


多 重 表 


图 3-26 最 后 一 趟 基数 排序 后 的 桶 


最 后 一 个 例子 阐述 链表 的 更 复杂 的 应 用 。 一 所 有 40 000 个 学 生 和 2 500 门 课程 的 大 学 需 


要 生成 两 种 类 型 的 报告 。 第 一 个 报告 列 
出 每 个 班 的 注册 者 ， 第 二 个 报告 列 出 每 
个 学 生 注册 的 班级 。 

常用 的 实现 方法 是 使 用 二 维 数组 。 
这 样 一 个 数组 将 有 1 亿 项 。 平均 大 约 一 
个 学 生 注册 三 门 课程 ， 因 此 实际 上 有 意 
义 的 数据 只 有 120 000 项 ， 约 占 0.126. 

现在 需要 的 是 列 出 每 个 班 及 每 个 班 
所 包含 的 学 生 的 表 。 我 们 也 需要 每 个 学 
生 及 其 所 注册 的 班级 的 表 。 图 3-27 显 
示 实 现 的 方法 。 

正如 该 图 所 显示 的 ， 我们 已 经 把 两 
个 表 合成 为 一 个 表 。 所 有 的 表 都 各 有 一 
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个 表 头 并 且 都 是 循环 的 。 比 如 ， 为 了 列 出 C3 班 的 所 有 学 生 ， 我 们 从 C3 开始 通过 向 右 行进 而 
遍历 其 表 。 第 一 个 单元 属于 学 生 S1。 虽 然 不 存在 明显 的 信息 ， 但 是 可 以 通过 跟踪 Sl 链表 直到 
该 表 表 头 而 确定 该 生 的 信息 。 一 旦 找到 该 生 信息 ， 我 们 就 转 回 到 C3 的 表 ( 在 遍历 该 生 的 表 
之 前 ,存储 了 我 们 在 课程 表 中 的 位 置 ) 并 找到 可 以 确定 属于 S3 的 男 外 一 个 单元 ， 我 们 继续 
并 发 现 S4 和 S5 也 在 该 班 上 。 对 任意 一 名 学 生 ， 我 们 也 可 以 用 类 似 的 方法 确定 该 生 注 册 的 
所 有 课程 。 

使 用 循环 表 节省 空间 但 是 要 花费 时 间 。 在 最 坏 的 情况 下 ， 如 果 第 一 个 学 生 注 册 了 每 一 
门 课程 ， 那 么 表 中 的 每 一 项 都 要 检测 以 确定 该 生 的 所 有 课程 名 。 因 为 在 本 例 中 每 个 学 生 注 
册 的 课程 相对 很 少 并 且 每 门 课程 的 注册 学 生 也 很 少 ， 最 坏 的 情况 是 不 可 能 发 生 的 。 如 果 怀 

会 产生 问题 ， 那 么 每 一 个 ( 非 表 头 ) 单 元 就 要 有 直接 指向 学 生 和 班级 的 表 头 的 指针 。 这 将 
使 空间 的 需求 加 倍 ， 但 是 却 简化 和 加 速 实现 的 过 程 。 


3.2.8 链表 的 游标 实现 





诸如 BASIC 和 FORTRAN 等 许 
多 语言 都 不 支持 指针 。 如 果 需 要 链表 
而 又 不 能 使 用 指针 ， 那 么 就 必须 使 用 | typeder pertoNode List; 
另外 的 实现 方法 。 我 们 将 描述 这 种 方 typedef PtrToNode Position; 


#ifndef Cursor H 


法 并 称 之 为 游标 (cursor) 实 现 法 void InitializeCursorSpace( void ); 
` DH E 3 T 
ae a — List MakeEmpty( List L ); 
在 链表 的 指针 实现 中 有 两 条 重要 int IsEmpty( const List L ); 
的 特性 int IsLast( const Position P, const List L J; 


Position Find( ElementType X, const List L ); 


1 数据 存储 在 一 组 结构 体 中 每 void Delete( ElementType X, List L ); 


Position FindPrevious( ElementType X, const List L ); 


ak A^ Y EN S void Insert( ElementType X, List L, Position P ); 
| 结构 体 包含 数据 以 及 指向 下 | void DeleteList( List L ); 


pk EA Position Header( const List L ); 
结构 体 的 指针 。 Position First( const List L ); 


LANGER. ey oe FL ay SE Position Advance( const Position P ); 
2. | 新 的 结 构 体 可 以 通过 调用 ElementType Retrieve( const Position P ); 
malloc 而 从 系统 全 局 内 存 (global 
memory) 中 得 到 ， 并 可 通过 调用 free 


/* Place in the implementation file */ 
而 释放 。 struct Node 


游标 法 必须 能 够 模仿 实现 这 两 条 {jontrype Element; 
特性 。 满 足 条 件 1 的 逻辑 方法 是 要 有 | Position Next; 
一 个 全 局 的 结构 体 数组 。 对 于 该 数组 
中 的 任何 单元 ， 其 数组 下 标 可 以 用 来 


#endif /* Cursor_H */ 


struct Node CursorSpace[ SpaceSize ]; 











代表 一 个 地 址 。 图 3-28 给 出 链表 游标 3-28 ”链表 游标 实现 的 声明 
实现 的 声明 。 


现在 我 们 必须 模拟 条 件 2， 让 CursorSpace 数组 中 的 单元 代行 malloc 和 free 的 职 
能 。 为 此 ， 我 们 将 保留 一 个 表 ( 即 freelist)， 这 个 表 由 不 在 任何 表 中 的 单元 构成 。 该 表 
将 用 单元 0 作为 表 头 。 其 初始 配置 如 图 3-29 所 示 。 
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= 
Slot Element Next 
0 1 
1 2 
2 3 
3 4 
4 5 
5 6 
6 7 
ri 8 
8 9 
9 10 
10 0 




















3-29 一 个 初始 化 的 CursorSpace 


对 于 Next. 0 的 值 等 价 于 NULL HE. CursorSpace 的 初始 化 是 一 个 简单 的 循环 结 
构 ， 我 们 将 它 留 作 练习 。 为 执行 malloc 功能 ,将 (在 表 头 后 面 的 ) 第 一 个 元 素 从 
freelist 中 删除 。 为 了 执行 free 功能 ， 我 们 将 该 单元 放 在 freelist 的 前 端 。 图 3-30 
展示 了 malloc 和 free 的 游标 实现 。 注 意 ， 如 果 没 有 可 用 空间 ， 那 么 我 们 的 例 程 可 以 通过 
置 P=0 正确 地 实现 。 它 表明 再 没有 空间 可 用 ,并且 也 可 以 使 CursorAlloc 的 第 二 行 成 为 
空 操作 (no-op)。 





static Position 
CursorAlloc( void ) £ 


Position P; 


P = CursorSpace[ 0 ].Next; 
CursorSpace[ 0 ].Next = CursorSpace[ P ].Next; 


return P; 


} 


static void 

CursorFree( Position P ) 

{ 
CursorSpace[ P ].Next = CursorSpace[ 0 ].Next; 
CursorSpace[ 0 ].Next = P; 


} 











图 3-30 例 程 : CursorAlloc 和 CursorFree 


有 了 这 些 ， 链 表 的 游标 实现 就 简单 了 。 为 了 前 后 一 致 ， 























[ stor Element vex || 
我 们 的 链表 实现 将 包含 一 个 表 头 节点 。 例 如 ， 在 图 3-31 中 ， ES 
如 果 工 的 值 是 5 而 M 的 值 为 3， 则 工 表示 链表 a、b、e， 而 oe $ 
M 表示 链表 c, dy f : ay ; 

为 了 写 出 用 游标 实现 链表 的 这 些 函数 ， 我 们 必须 传递 和 Pe E. 
返回 与 指针 实现 相同 的 参数 。 这 些 例 程 很 简单 。 图 3-32 是 一 XE ‘ 
个 测试 表 是 否 为 空 表 的 函数 。 图 3-33 实现 对 当前 位 置 是 否 是 M 2 
表 的 未 尾 的 测试 。 图 3-34 中 的 函数 Pina LL rp X. 的 位 a 5 i 











置 。 实 现 删除 的 程序 在 图 3-35 中 给 出 。 再 有 ， 游 标 实现 的 接 wide 
口 和 指针 实现 是 一 样 的 。 最 后 ， 图 3-36 表示 Insert 的 游标 “图 331 链表 游标 实现 的 例子 





/* Return true if L is empty */ 
int 

IsEmpty( List L ) 

{ 


} 


return CursorSpace[ L ].Next == 0; 











图 3-32 ”测试 一 个 链表 是 否 为 空 的 函数 一 一 游标 实现 








/* Return true if P is the last position in list L */ 
/* Parameter L is unused in this implementation */ 
int 

IsLast( Position P, List L ) 

{ 


} 


return CursorSpace[ P ].Next == 0; 








图 3-33 Mit P 是否 是 链表 的 末尾 的 函数 一 一 游标 实现 
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/* Return Position of X in L; 0 if not found */ 
/* Uses a header node */ 


Position 

Find( ElementType X, List L ) 

{ 

Position P; 

y* 1*7 P - CursorSpace[ L ].Next; 
y* 2*/ while( P && CursorSpace[ P ].Element != X ) 
/* 3*/ P = CursorSpace[ P ].Next; 
/* 4*/ return P; 

} 








E 3-34 ” 例 程 Find 一 一 游标 实现 








/* Delete first occurrence of X from a list */ 
/* Assume use of a header node */ 


void 
Delete( ElementType X, List L ) 


{ 


Position P, TmpCell; 
P = FindPrevious( X, L ); 
ifC HIsLast( P, L b) ) /* Assumption of header use */ 


{ /* X is found; delete it */ 
TmpCell = CursorSpace[ P ].Next; 


CursorSpace[ P ].Next = CursorSpace[ TmpCell ].Next; 


CursorFree( TmpCell ); 











3-35 ”对 链表 进行 删除 操作 的 例 程 Delete 


游标 实现 
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/* Insert (after legal position P) */ 
/* Header implementation assumed */ 
/* Parameter L is unused in this implementation */ 


void 
Insert( ElementType X, List L, Position P ) 


Position TmpCel1; 


f® DAZ TmpCell = CursorAlloc( ); 

LO QE ifC TmpCell == 0 ) 

yf* 3*/ FatalError( "Out of space!!!" ); 

yp GEL CursorSpace[ TmpCell ].Element = X; 

J= GE CursorSpace[ TmpCell ].Next = CursorSpace[ P ].Next; 
LF? 857 CursorSpace[ P ].Next = TmpCell; 











3-36 ”对 链表 进行 插入 操作 的 例 程 [Insert 一 一 游标 实现 


其 余 例 程 的 编码 类 似 。 关 键 的 一 点 是 ， 这 些 例 程 遵循 ADT 的 规范 。 它 们 采用 特定 的 变 
量 并 执行 特定 的 操作 。 实 现 对 用 户 是 透明 的 。 游 标 实现 可 以 用 来 代替 链表 实现 ， 实际 上 在 
程序 的 其 余部 分 不 需要 变化 。 由 于 缺少 内 存 管理 例 程 ， 因 此 ， 如 果 运 行 的 Fing 函数 相对 
很 少 ， 则 游标 实现 的 速度 会 显著 加 快 。 

freelist 从 字面 上 看 表示 一 种 有 趣 的 数据 结构 。 从 freelist 中 删除 的 单元 是 刚刚 
由 free 放 和 人 那里 的 单元 。 因 此 ， 最 后 放 入 freelist 中 的 单元 最 先 拿 走 。 有 一 种 数据 结 
构 也 具有 这 种 性 质 ， 叫 作 栈 (stack) ， 它 是 下 一 节 要 讨论 的 课题 。 


3.3 栈 ADT 


3.3.1 eH 


栈 是 限制 插入 和 删除 只 能 在 一 个 位 置 上 进行 的 表 ， 该 位 置 是 表 的 末端 ， 叫 作 栈 的 项 
(top) 。 对 栈 的 基本 操作 有 Push( 进 栈 ) 和 Pop( 出 栈 )， 前 者 相当 于 插入 ， 后 者 则 是 删除 最 
后 插入 的 元 素 。 最 后 插入 的 元 素 可 以 通过 使 用 Top 例 程 在 执行 Pop 之 前 进行 检查 。 对 空 栈 
进行 的 Pop 或 Top 一 般 被 认为 是 栈 ADT 的 错误 。 男 一 方面 ， 当 运行 Push 时 空间 用 尽 是 
一 个 实现 错误 ,但 不 是 ADT 错误 。 

栈 有 时 又 叫 作 LIFO (后进 先 出 ) 
表 。 在 图 3-37 中 描述 的 模型 只 象征 着 
Push 是 输入 操作 而 Pop 和 Top 是 输 
出 操作 。 普 通 的 清空 栈 的 操作 和 判断 
是 否 空 栈 的 测试 都 是 栈 的 操作 指令 系 
统 的 一 部 分 ， 但 是 ， 对 栈 所 能 够 做 的 图 3-37 栈 模型 : 通过 Push 向 栈 输入 ， 通 过 Pop 从 栈 输出 
基本 上 也 就 是 Push 和 Pop 操作 。 

图 3-38 表示 在 进行 若干 操作 后 的 一 个 抽象 的 栈 。 一 般 的 模型 是 ， 存 在 某 个 元 素 位 于 栈 





Pop(S) fax Push(X,S) 





Top(S) 











项 ， 而 该 元 素 是 唯一 的 可 见 元 素 。 


3.3.2 材 的 实现 


由 于 栈 是 一 个 表 ， 因 此 任何 实现 表 的 方法 都 能 
实现 栈 。 我 们 将 给 出 两 种 流行 的 实现 方法 ， 一 种 方 
法 使 用 指针 ， 而 另 一 种 方法 则 使 用 数组 。 但 是 ， 正 
如 我 们 在 前 一 节 看 到 的 ， 如 果 使 用 好 的 编程 原则 ， 
那么 调用 例 程 不 必 知 道 使 用 的 是 哪 种 方法 。 


栈 的 链表 实现 


栈 的 第 一 种 实现 方法 是 使 用 单 链表 。 我 们 通过 在 表 前 端 插 入 来 实现 Push， 通 过 删除 表 
前 端 元 素 实 现 Pop. Top 操作 只 是 检查 表 前 端 元 素 并 返回 它 的 值 。 有 时 Pop 操作 和 Top fé 
作 合 二 为 一 。 我 们 本 可 以 使 用 前 一 节 的 链表 例 程 ， 但 为 了 清楚 起 见 我 们 还 是 从 头 开始 重 写 


栈 的 例 程 。 


首先 ， 我 们 在 图 3-39 中 给 出 一 些 定 义 。 实 现 栈 要 用 到 一 个 表 头 。 图 3-40 表明 测试 空 栈 


与 测试 空 表 的 方式 相同 。 
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图 3-38 RRE. 只 有 栈 顶 元 素 是 可 访问 的 








#ifndef _Stack_h 


struct Node; 
typedef struct Node *PtrToNode; 
typedef PtrToNode Stack; 


int IsEmpty( Stack S ); 

Stack CreateStack( void ); 
void DisposeStack( Stack S ); 
void MakeEmpty( Stack S ); 


void Push( ElementType X, Stack S ); 


ElementType Top( Stack S ); 
void Pop( Stack S ); 


#endif /* Stack h */ 


/* Place in implementation file */ 


/* Stack implementation is a linked list with a header */ 


struct Node 

{ 
ElementType Element; 
PtrToNode Next; 

h 








图 3-39 dE ADT 链表 实现 的 类 型 声明 


创建 一 个 空 栈 也 很 简单 ， 我 们 只 要 创建 一 个 头 节点 ，MakeEmpty KH Next 指针 指向 
NULL( 见 图 3-41) 。 


Push 是 通过 向 链表 前 端 进行 


插入 而 实现 的 ， 其 中,， 表 的 前 端 作为 栈 顶 ( 见 
图 3-42). Top 的 实现 是 通过 检查 表 在 第 一 个 位 
置 上 的 元 素 而 完成 的 ( 见 图 3-43)。 最 后 ，Pop 是 


通过 删除 表 的 前 端的 元 素 而 实现 的 ( 见 图 3-44) 。 








int 


IsEmpty( Stack S ) 
{ 


} 


return S->Next == NULL; 





3-40 ”测试 栈 是 否 是 空 栈 的 例 程 一 一 链表 实现 
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Stack 
CreateStack( void ) 
{ 

Stack S; 


S = malloc( sizeof( struct Node ) ); 
if( S == NULL ) 

FatalError( "Out of space!!!" ); 
S->Next == NULL; 
MakeEmpty( S ); 
return S; 


} 


void 
MakeEmpty( Stack S ) 


ifC S == NULL ) 
Error( "Must use CreateStack first" ); 
else 
whileC !IsEmpty( S ) ) 
PopC S ); 











图 3-41 创建 一 个 空 栈 的 例 程 一 一 链表 实现 





void 
Push( ElementType X, Stack S ) 


{ 
PtrToNode TmpCell; 


TmpCell = malloc( sizeof( struct Node ) ); 
if( TmpCell == NULL ) 
FatalError( "Out of space!!!" ); 
else 
{ 
TmpCell->Element = X; 
TmpCell-»Next = S->Next; 
S->Next = TmpCell; 














图 3-42 元 素 进 栈 的 例 程 链表 实现 





ElementType 
Top( Stack S ) 
{ 
ifC !IsEmpty( S ) ) 
return S->Next->Element; 
Error( "Empty stack" ); 
return 0; /* Return value used to avoid warning */ 











图 3-43 返回 栈 顶 元 素 的 例 程 一 一 链表 实现 


很 清楚 ， 所 有 的 操作 均 花 费 常数 时 间 ， 因 为 这 些 例 程 没有 任何 地 方 涉及 栈 的 大 小 ( 空 栈 
除外 )， 更 不 用 说 依赖 于 栈 大 小 的 循环 了 。 这 种 实现 方法 的 缺点 在 于 对 malloc 和 free 的 
调用 的 开销 是 昂贵 的 ， 特 别 是 与 指针 操作 的 例 程 相 比 。 有 的 缺点 通过 使 用 第 二 个 栈 可 以 避 
免 ， 第 二 个 栈 初 始 时 为 空 栈 。 当 一 个 单元 从 第 一 个 栈 弹出 时 ， 它 只 是 被 放 到 了 第 二 个 栈 中 。 
此 后 ， 当 第 一 个 栈 需 要 新 的 单元 时 ， 它 首先 去 检查 第 二 个 栈 。 
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栈 的 数组 实现 
一 种 实现 方法 避免 了 指针 并 且 可 能 是 更 流行 的 解决 方案 。 这 种 策略 的 唯一 潜在 危害 





是 我 们 需要 提前 声明 一 个 数组 的 大 小 。 一 般 说 = 

来 ， 这 并 不 是 问题 ， 因 为 在 典型 的 应 用 程序 中 ， heir Stack $3 

即使 有 相当 多 的 栈 操作 ， 在 任意 时 刻 栈 元 素 的 实 

际 个 数 从 不 会 太 大 。 声 明 一 个 数组 足够 大 而 不 至 ifC IsEmpty( S ) ) 

于 浪费 太 多 的 空间 通常 并 没有 什么 困难 。 如 果 不 itd 

能 做 到 这 一 点 ， 那 么 节省 的 做 法 是 使 用 链表 来 1 

实现 。 hes hie 
用 一 个 数组 实现 栈 是 很 简单 的 。 每 一 个 栈 有 jv 











一 个 Topofstack， 对 于 空 栈 它 是 一 1( 这 就 是 空 
ADIL). WORT X RARE, A TH AAU TRONS eee 
们 将 TopofStack 加 1， 然 后 置 Stack[TopOfStack]— X. HP stack 是 代表 具体 栈 的 
数组 。 为 了 弹出 栈 元 素 ， 我 们 置 返回 值 为 Stack[ TopOfStack |] 然后 Topo£Stack W 1. 
当然 ， 由 于 潜在 地 存在 多 个 栈 ， 因 此 Stack 数组 和 TopofStack 只 代表 一 个 栈 结 构 的 一 部 
分 。 使 用 全 局 变量 和 固定 名 字 来 表示 这 种 (或 任意 ) 数 据 结构 非常 不 好 ， 因 为 在 大 多 数 实际 
情况 下 总 是 存在 多 个 栈 。 当 编写 实际 程序 的 时 候 ， 你 应 该 尽 可 能 严格 地 遵循 模型 ， 这样 ， 
除 一 些 栈 例 程 外 ， 你 的 程序 的 任何 部 分 都 没有 存 取 被 每 个 栈 列 含 的 数组 或 栈 顶 (top-of- 
stack) 变 量 的 可 能 。 这 对 所 有 的 ADT 操作 都 是 成 立 的 。 像 Ada 和 C++ 这 样 的 现代 程序 设 
计 语 言 实际 上 都 能 够 实施 这 个 法 则 。 

注意 ， 这 些 操作 不 仅 以 党 数 时 间 运 行 ， 而 且 是 以 非常 快 的 常数 时 间 运 行 。 在 某 些 机 器 
上 ， 阁 在 带 有 自 增 和 自 减 寻 址 功能 的 寄存 器 上 操作 ， een dt Pop 都 可 以 写成 
一 条 机 需 指 令 。 最 现代 化 的 计算 机 将 栈 操作 作为 它 的 指令 系统 的 一 部 分 ， 这 个 事实 强化 了 
这 样 一 种 观念 ， i iiim 2 Id 

一 个 影响 栈 的 执行 效率 的 问题 是 错误 检测 。 链 表 实 现 仔 细 地 检查 错误 。 正 如 上 面 所 描 
术 的 ， 对 空 栈 的 Pop 或 者 对 满 栈 的 Push 都 将 超出 数组 的 界限 并 引起 程序 骨 溃 。 显 然 ， 我 
们 不 愿意 出 现 这 种 情况 。 但 是 ， 如 果 把 对 这 些 条 件 的 检测 放 到 数组 实现 过 程 中 ， 那 就 很 可 
能 要 花费 像 实际 栈 操作 那样 多 的 时 间 。 由 于 这 个 原因 ， 除 非 在 错误 处 理 极 其 重要 的 场合 (如 
在 操作 系统 中 )， 一 般 在 栈 例 程 中 省 去 错误 检测 就 成 了 惯用 手法 。 虽 然 在 多 数 情况 下 可 能 通 
过 声明 一 个 栈 大 到 不 至 于 使 得 操作 溢出 ， 并 保证 使 用 Pop 操作 的 例 程 绝 不 对 一 个 空 栈 执行 
Pop 而 侥幸 避免 对 错误 的 检测 ， 但是， 这 充其量 只 不 过 是 使 得 程序 得 以 正常 运行 而 已 ， 特 
别 是 当 程序 很 大 并 且 是 由 不 止 一 个 人 编写 或 分 若干 次 写成 的 时 候 。 因 为 栈 操作 花费 如 此 快 
的 常数 时 间 ， 所 以 一 个 程序 的 主要 运行 时 间 很 少 会 花 在 这 些 例 程 上 面 。 这 就 意味 着 ， 忽 略 
错误 检测 一 般 是 不 妥 的 。 你 应 该 随时 编写 错误 检测 的 代码 ; MRE TICK, WAY ET 88 
实 耗费 太 多 时 间 时 你 总 可 以 将 它们 去 掉 。 在 进行 上 面 的 评述 以 后 ， 我 们 现在 就 可 以 编写 用 
数组 实现 一 般 的 栈 的 例 程 了 。 
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在 图 3-45 中 Stack( 栈 ) 定 义 为 指向 一 个 结构 体 的 指针 。 该 结构 体 包 含 TopofStack sh 


和 Capacity 域 


o 一旦 知道 最 大 容量 ， 则 该 栈 即 可 被 动态 地 确定 。 图 3-46 创建 了 一 个 具有 


给 定 的 最 大 值 的 栈 。 第 3 一 5 行 指 定 该 栈 的 结构 ， 而 第 6 一 8 行 则 指定 栈 的 数组 。 第 9 行 和 
第 10 行 初始 化 域 TopofStack 和 域 capacity。 栈 的 数组 不 需要 初始 化 。 第 11 行 返回 栈 。 








#ifndef _Stack_h 


struct StackRecord; 
typedef struct StackRecord *Stack; 


int IsEmpty( Stack S ); 

int IsFull( Stack S ); 

Stack CreateStack( int MaxElements ); 
void DisposeStack( Stack S ); 

void MakeEmpty( Stack S ); 

void Push( ElementType X, Stack S ); 
ElementType Top( Stack S ); 

void Pop( Stack S ); 

ElementType TopAndPop( Stack S ); 


#endif /* Stack h */ 


/* Place in implementatioin file */ 

/* Stack implementation is a dynamically allocated array */ 
#define EmptyTOS ( -1 ) 

#define MinStackSize ( 5 ) 


struct StackRecord 

{ 
int Capacity; 
int TopOfStack; 
ElementType *Array; 


] 








图 3-45 HR Ps RB — — 34 £B Sc XO 





/* 
/* 


/* 
/* 
/* 


/* 
/* 
/* 
/* 


Stack 
CreateStack( int MaxElements ) 


{ 
Stack S; 


1*/ if( MaxElements < MinStackSize ) 
2*/ Error( "Stack size is too small" ); 


- malloc( sizeof( struct StackRecord ) ); 
fC S == NULL ) 
FatalError( "Out of space!!!" ); 


3*/ S 
4*/ i 
5*/ 


6*7 S->Array = malloc( sizeof( ElementType ) * MaxElements ); 


7*/ if( S->Array == NULL ) 
8*/ FatalError( "Out of space!!!" ); 
9*/ S->Capacity = MaxElements; 


/*10*/ MakeEmpty( S ); 


/*11*/ return S; 








B] 3-46 ” 栈 的 创建 一 一 数组 实现 


为 了 释放 栈 结构 体 应 该 编写 例 程 DisposeStack。 这 个 例 程 首先 释放 栈 数 组 ， 然 后 释 
放 栈 结构 体 ( 见 图 3-47) 。 由 于 CreateStack 在 栈 的 数组 实现 中 需要 一 个 参数 ， 而 在 链表 


SBM AS EC. KE de AY Se BAS ST E B S «o 那么 这 个 使 用 栈 的 例 程 就 需 


要 知道 正在 使 用 的 是 哪 种 实现 方法 。 不 幸 的 
是 ， 效 率 和 软件 理想 主义 常常 发 生 冲 突 。 

我 们 已 经 假设 所 有 的 栈 均 处 理 相 同类 型 的 
元 素 。 在 许多 编程 语言 中 ， 如 果 存 在 不 同类 型 
的 栈 ， 那 么 我 们 就 需要 为 每 种 不 同类 型 的 栈 重 
新 编写 一 套 栈 的 新 例 程 ， 同 时 给 每 套 例 程 赋予 
不 同 的 名 字 。 在 C++ 中 提供 了 更 彻底 的 方法 ， 
它 允 许 我 们 编写 一 套 一 般 的 栈 例 程 ， 对 任何 类 
型 的 栈 都 能 正常 运行 。C++ 还 允许 几 种 不 同类 
型 的 栈 保留 相同 的 过 程 和 函数 名 (如 Push 和 
Pop)， 通 过 检验 主 调 例 程 的 类 型 ， 编 译 程序 可 
决定 使 用 哪些 例 程 。 

在 进行 了 上 面 的 阐述 以 后 ， 现 在 我 们 就 来 
重 写 五 个 栈 例 程 。 我 们 将 以 纯 ADT Ut fi pg 
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[ void 
DisposeStack( Stack S ) 
ifC S != NULL ) 
free( S->Array ); 


free( S ); 
} 





} 





图 3-47 释放 栈 的 例 程 一 一 数组 实现 





int 
IsEmpty( Stack S ) 
{ 


return S->TopOfStack == EmptyTOS; 
} 





图 3-48 检测 栈 是 否 是 空 栈 的 例 程 
一 一 数组 实现 


数 和 过 程 的 标题 等 同 于 链表 实现 。 这 些 例 程 本 身 是 非常 简单 的 ， 并且 严 格 遵 循 图 中 的 描述 


( 见 图 3-48 到 图 3-52)。 





d void 


MakeEmpty( Stack S ) 


S->TopOfStack = EmptyTOS; 


} 





图 3-49 创建 一 个 空 栈 的 例 程 一 一 数组 实现 





void 


{ 
TFC TsFull€ S y ) 


else 





Push( ElementType X, Stack S ) 


Error( "Full stack" ); 


S->Array[ ++S->TopOfStack ] = X; 





图 3-50 ”元素 进 栈 的 例 程 一 一 数组 实现 





ElementType 
Top( Stack S ) 


ifC !IsEmpty( S ) ) 
Error( "Empty stack" ); 


} 





return S->Array[ S->TopOfStack ]; 


return 0; /* Return value used to avoid warning */ 





图 3-51 返回 栈 项 元 素 的 例 程 一 一 数组 实现 
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void 
Pop( Stack S ) 


ifC IsEmpty( S ) ) 
Error( "Empty stack" ); 
else 
S-»TopOfStack-- ; 








} 





图 3-52 从 栈 弹 出 元 素 的 例 程 一 一 数组 实现 


|70 | Pop 偶尔 写成 返回 弹出 的 元 素 ( 并 使 栈 改变 ) 的 函数 。 虽 然 当 前 的 想法 是 函数 不 应 该 改 
变 其 输入 参数 ， 但 是 图 3-53 表明 这 在 C 中 是 最 方便 的 方法 。 





ElementType 
TopAndPop( Stack S ) 
{ 


ifC !IsEmpty( S ) ) 
return S-»Array[ S->TopOfStack-- ]; 
Error( "Empty stack" ); 
return 0; /* Return value used to avoid warning */ 








} 





图 3-53 ”给 出 栈 顶 元 素 并 从 栈 弹 出 的 例 程 一 一 数组 实现 


3. 3.3 应 用 


毫 不 奇怪 ， 如 果 我 们 把 操作 限制 于 一 个 表 ， 那 么 这 些 操 作 会 执行 得 很 快 。 然 而 ， 令 人 
惊奇 的 是 ， 这 些 少量 的 操作 非常 强大 和 重要 。 在 栈 的 许多 应 用 中 ,我 们 给 出 三 个 例子 ， 第 
三 个 实例 深刻 说 明 程序 是 如 何 组 织 的 。 

平衡 符号 

编译 器 检查 程序 的 语法 错误 ， 但 是 常常 由 于 缺少 一 个 符号 (如 遗漏 一 个 花 括号 或 注释 起 
始 符 ) 引 起 编译 器 列 出 上 百 行 的 诊断 ， 而 真正 的 错误 并 没有 找 出 。 

在 这 种 情况 下 ， 可 以 使 用 一 个 程序 来 检验 是 否 每 个 符号 都 成 对 出 现 。 于 是 ， 每 一 个 右 
花 括号 、 右 方 括号 及 右 圆 括号 必然 对 应 其 相应 的 左 括号 。 序 列 “[()]” 是 合法 的 ， 但 
“CC ] )” 是 错误 的 。 显 然 ， 不 值得 为 此 编写 一 个 大 型 程序 ， 事 实 上 检验 这 些 事情 是 很 容易 
的 。 为 简单 起 见 ， 我 们 仅 就 圆 括号 、 方 括号 和 花 括 号 进行 检验 并 忽略 出 现 的 任何 其 他 字符 。 

这 个 简单 的 算法 用 到 一 个 栈 ， 叙 述 如 下 : 


做 一 个 空 栈 。 读 入 字符 直到 文件 尾 。 如 果 字 符 是 一 个 开放 符号 ， 则 将 其 推 入 栈 中 。 
如 果 字 符 是 一 个 封闭 符号 ， 则 当 栈 空 时 报错 ; 否则 ， 将 栈 元 素 弹 出 。 如 果 弹 出 的 符号 
不 是 对 应 的 开放 符号 ， 则 报错 。 在 文件 尾 ， 如 果 栈 非 空 则 报错 。 
你 应 该 能 够 确信 这 个 算法 是 会 正确 运行 的 。 很 清楚 ， 它 是 线性 的 ， 事 实 上 它 只 需 对 输 
和 人 进行 一 趟 检验 。 因 此 ， 它 是 在 线 (onrline) 的 ， 是 相当 快 的 。 当 报错 时 ， 决 定 如 何 处 理 需 
71] 要 做 一 些 附加 的 工作 一 一 例如 判断 可 能 的 原因 。 
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FARER 

假设 我 们 有 一 个 便携 计算 器 并 想 要 计算 一 趟 外 出 购物 的 花费 。 为 此 ， 我 们 将 一 列 数 据 
相 加 并 将 结果 乘 以 1.06 一 一 它们 是 所 购物 品 的 价格 以 及 附加 的 地 方 税 。 如 果 购 物 各 项 花 销 
为 4.99、5.99 和 6.99， 那 么 输入 这 些 数据 的 自然 的 方式 将 是 

4. 99 十 5. 994-6. 99 x 1. 06— 

随 着 计算 器 的 不 同 ， 这 个 结果 或 者 是 所 要 的 答案 19.05， 或 者 是 科学 答案 18. 39。 最 简单 的 
四 功能 计算 器 将 给 出 第 一 个 答案 ， 但 是 许多 先进 的 计算 器 是 知道 乘法 的 优先 级 是 高 于 加 法 的 。 

另 一 方面 ， 有 些 项 是 需要 上 税 的 而 有 些 项 则 不 需要 ， 因 此 ， 如 果 只 有 第 一 项 和 最 后 一 
项 是 要 上 税 的 ， 那 么 

4. 99 x 1. 064-5. 99 十 6. 99 x 1. 06= 
将 在 科学 计算 器 上 给 出 正确 的 答案 (18. 69) 而 在 简单 计算 器 上 给 出 错误 的 答案 (19. 37), RH 
学 计算 器 一 般 包含 括号 ， 因 此 我 们 总 可 以 通过 加 括号 的 方法 得 到 正确 的 答案 ， 但 是 使 用 简 
单 计 算 器 则 需要 记 住 中 间 结 果 。 

该 例 的 典型 计算 顺序 可 以 是 将 4. 99 和 1. 06 相 乘 并 存 为 Ai ， 然 后 将 5. 99 和 A 相 加 ， 
再 将 结果 存 人 A, 。 我 们 再 将 6. 99 和 1. 06 相 乘 并 将 答案 存 为 A, ， 最 后 将 A! Al A, 相 加 并 将 
最 后 结果 放 入 A, 。 我 们 可 以 将 这 种 操作 顺序 书写 如 下 : 

4. 99 1.06x5.99 十 6.99 1. 06 « + 

这 个 记 法 叫 作 后 缓 (postfix) 或 着 波兰 (reverse Polish) 记 法 ， 其 求 值 过 程 恰好 就 是 我 们 
上 面 所 描述 的 过 程 。 计 算 这 个 问题 最 容易 的 方法 是 使 用 一 个 栈 。 当 见 到 一 个 数 时 就 把 它 推 
入 栈 中 ; 在 遇 到 一 个 运算 符 时 该 算 符 就 作用 于 从 该 栈 弹 出 的 两 个 数 ( 符 号 ) 上 ， 将 所 得 结果 
推 人 栈 中 。 例 如 ， 后 绥 表 达 式 

6523-8» 34 x 
计算 如 下 : 前 四 个 字符 放 入 栈 中 ， 此 时 栈 变 成 

| 


| TopOfStack — 








3 
2 
5 
6 





| 
Li | 
下 面 读 到 一 个 “十 ”号 ， 所 以 3 和 2 从 栈 中 弹出 ， 并 将 它们 的 和 5 压 人 栈 中 。 











TopOfStack 一 5 














接着 ，8 HERE. 








| TopOfStack 一 
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现在 见 到 一 个 “x” 号 ， 因此 8 和 5 弹出 ,并且 5x 8=40 进 栈 。 








TopOfStack — 40 
5 








接着 又 见 到 一 个 “十 ”号 ， 因 此 40 和 5 被 弹出 ， 并 且 54+ 40=45 进 栈 。 





TopOfStack 一 








现在 将 3 压 人 栈 中 。 








TopOfStack — 3 








然后 “十 ”使 得 3 和 45 从 栈 中 弹出 ， 并 将 45 十 3 二 48 KARP. à 


TopOfStack — 











最 后 ， 遇 到 一 个 “* ”号 ， 从 栈 中 弹出 48 AG, KAR 6 x 48—288 KART. 








TopofStack — 








计算 一 个 后 级 表达 式 花 费 的 时 间 是 OCN) , pl font 
or agence ns 注意 ， 当 一 个 表达 式 以 后 
号 给 出 时 ， 没 有 必要 知道 任何 优先 规则 。 一 个 明显 的 优点 。 


中 缀 到 后 缀 的 转换 

栈 不 仅 可 以 用 来 计算 后 级 表达 式 的 值 ， 而 且 我 们 还 可 以 用 栈 将 一 个 标准 形式 的 表达 式 
Ca MY fe rp X infix) ) 转 换 成 后 级 式 。 我 们 通过 只 允许 操作 十 、x 、(、)， 并 坚持 普通 的 优 
先 级 法 则 而 将 一 般 的 问题 浓缩 成 小 规模 的 问题 。 我 们 还 要 进一步 假设 表达 式 是 合法 的 。 假 
ERTH PARKI 

atb*ct(d*etf) *g 
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转换 成 后 缀 表达 式 。 正 确 的 答案 是 

abcx+dexft+tg* + 

当 读 到 一 个 操作 数 的 时 候 ， 立 即 把 它 放 到 输出 中 。 操 作 符 不 立即 输出 ， 所 以 必须 先 存 
在 某 个 地 方 。 正 确 的 做 法 是 将 已 经 见 到 过 的 操作 符 放 进 栈 中 而 不 是 放 到 输出 中 。 当 遇 到 左 
圆 括号 时 我 们 也 要 将 其 推 入 栈 中 。 我 们 从 一 个 空 栈 开 始 计算 。 

如 果 见 到 一 个 右 括号 ， 那 么 就 将 栈 元 素 弹 出 ， 将 弹出 的 符号 写 出 直到 我 们 遇 到 一 个 (对 
应 的 ) 左 括号 ， pae pi siap bai 并 不 输出 。 

如 果 见 到 任何 其 他 的 符号 (“十 ”“x*”*“*(”), 那么 我 们 从 栈 中 弹出 栈 元 素 直 到 发 现 优先 
级 更 低 的 元 素 为 止 。 有 一 个 例外 : ‘awa “)” 的 时 候 ， 否 则 我 们 绝 不 从 栈 中 移 
走 “(”。 对 于 这 种 操作 ,“ 十 ”的 优先 级 最 低 ， 而 “(” 的 优先 级 最 高 。 当 从 栈 弹 出 元 素 的 
工作 完成 后 ,我 们 再 将 操作 符 压 入 栈 中 。 

最 后 ， 如 果 读 到 输入 的 末尾 ， 我 们 将 栈 元 素 弹 出 直到 该 栈 变 成 空 栈 ,将 符号 写 到 输 
dim. 

为 了 理解 这 种 算法 的 运行 机 制 ， Fhe ATT FR Dor B5 rp ds AA CEN BO SX. HE. 
读 和 人 a， 于 是 将 它 输出 。 然 后 ， 读 入 “十 ”并 放 和 人 栈 中 。 接 着 是 读 入 b 并 输出 。 这 一 时 刻 的 
状态 如 下 : 


A [ ab ] 
m Sh 


这 时 读 和 人 “* ”。 操 作 符 栈 的 栈 顶 元 素 比 “* ”的 优先 级 低 ， 故 没有 输出 ,“* ” 进 栈 。 接 
着 , 将 c 读 和 人 并 输出 。 至 此 ， 我 们 有 











* 


NET J 
Fk 输出 


后 面 的 符号 是 一 个 “十 ”。 检 查 一 下 栈 ， 我们 发 现 ， 需 要 将 “x* ”从 栈 弹出 并 放 到 输出 中 
弹出 栈 中 剩 下 的 “十 ”， 该 操作 符 不 比 刚刚 遇 到 的 符号 “十 ”优先 级 低 ， 而 是 有 相同 的 优先 
级 ; 然后 ， 将 刚刚 遇 到 的 “十 ” 压 入 栈 中 。 


| + | abeta | 




















FÈ 俞 出 
下 一 个 读 入 的 符号 ， 由 于 有 最 高 的 优先 级 ， 因 此 将 它 放 进 栈 中 。 然 后 , 将 d ik 
入 并 输出 。 
| 
" 
[ abe*+d | 
栈 iir 


继续 进行 ， 我 们 又 读 到 一 个 “x*”。 除 非 正在 处 理 闭 括 号 ， 否 则 开 括 号 不 会 从 栈 中 弹出 ， 因 
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此 没有 输出 。 下 一 个 是 e， 将 它 读 入 并 输出 。 


* 
( 
ge L abc*+de | 


Fe 输出 
再 往 后 读 到 的 符号 是 “十 ”。 我 们 将 “x* ”弹出 并 输出 ， 然 后 将 “十 ” 压 入 栈 中 。 之 后 ,我 
们 读 到 了 并 输出 。 























+ 
( 

+ | abc*+de*f 
Hi 输出 


现在 ， 我 们 读 到 一 个 “)”， 因 此 将 在 “(” 之 上 的 栈 元 素 弹 出 ， 这 里 将 一 个 “十 ”号 输出 。 





| 
| 
| + | | abc*+de*f+ 





E: 输出 


下 面 又 读 到 一 个 “* ”， 将 该 算 符 压 人 栈 中 。 然 后 ， 将 g 读 入 并 输出 。 


| 
» 
- [ abc*+de*f+g | 


FR 输出 
现在 输入 为 空 ， 因 此 我 们 将 栈 中 的 符号 全 部 弹出 并 输出 ， 直 到 栈 变 成 空 栈 。 











abe*+de*f+g*+ | 
E E 

与 前 面相 同 ， 这 种 转换 只 需要 OCN) 时 间 并 经 过 一 趟 输入 后 运算 即 可 完成 。 我 们 可 以 通 
过 指定 减法 和 加 法 有 相同 的 优先 级 以 及 乘法 和 除法 有 相同 的 优先 级 而 将 减法 和 除法 添加 到 
指令 集中 。 一 种 巧妙 的 想法 是 将 表达 式 “a 一 b 一 ce” 转换 成 “ab 一 c 一 ”而 不 是 转换 成 “abce 
一 一 ”。 我 们 的 算法 做 了 正确 的 工作 ， 因 为 这 些 操作 符 是 从 左 到 右 结合 的 。 一 般 情 况 未 必 如 
此 ， 比 如 下 面 的 表达 式 就 是 从 右 到 左 结合 的 : 27 —2'—256, MAREE 45—64,. RTI 
运算 添加 到 指令 集中 的 问题 留 作 练习 。 

函数 调用 

检测 平衡 符号 的 算法 提供 一 种 实现 孔 数 调用 的 方法 。 这 里 的 问题 是 ， 当 调用 一 个 新 函 
数 时 ， 主 调 例 程 的 所 有 局 部 变量 需要 由 系统 存储 起 来 ,否则 被 调用 的 新 函数 将 会 覆盖 调用 
例 程 的 变量 。 不 仅 如 此 ， 该 主 调 例 程 的 当前 位 置 必须 要 存储 ， 以 便 在 新 水 数 运 行 完 后 知道 
向 哪里 转移 。 这 些 变量 一 般 由 编译 器 指派 给 机 器 的 寄存 器 ， 但 存在 某 些 冲突 (通常 所 有 的 过 
程 都 将 某 些 变量 指派 给 1 号 寄存 器 ) ， 特 别 是 涉及 递归 的 时 候 。 该 问题 类 似 于 平衡 符号 的 原 
因 在 于 ， 函 数 调用 和 函数 返回 基本 上 类 似 于 开 插 号 和 闭 括 号 ， 二 者 想法 是 一 样 的 。 

当 存 在 函数 调用 的 时 候 ， 需 要 存储 的 所 有 重要 信息 ， 诸 如 寄存 器 的 值 ( 对 应 变量 的 名 
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字 ) 和 返回 地 址 ( 它 可 从 程序 计数 器 得 到 ， 典 型 情况 下 计数 器 就 是 一 个 寄存 器 ) 等 ， 都 要 以 抽 
象 的 方式 存在 “一 张 纸 上 ”并 被 置 于 一 个 堆 (pile) 的 顶部 。 然 后 控制 转移 到 新 函数 ， 该 函数 
自由 地 用 它 的 一 些 值 代替 这 些 寄存 器 。 如 果 它 又 进行 其 他 的 函数 调用 ， 那么 它 也 遵循 相同 
的 过 程 。 当 该 函数 要 返回 时 ， 它 查看 堆 顶 部 的 那 张 “ 纸 ”并 复原 所 有 的 寄存 器 。 然 后 它 进 
行 返 回转 移 。 

显然 ， 所 有 工作 均 可 由 一 个 栈 来 完成 ， 而 这 正 是 在 实现 递归 的 每 一 种 程序 设计 语言 
实际 发 生 的 事实 。 所 存储 的 信息 或 称 为 活动 记录 (activation record), sX i] 4E 2X, W (stack 
frame)。 在 典型 情况 下 ， 需 要 做 些微 调 : 当前 环境 是 由 栈 顶 描述 的 。 因 此 ,一 条 返回 语句 
就 可 给 出 前 面 的 环境 (不 用 复制 )。 在 实际 计算 机 中 的 栈 常 常 是 从 内 存 分 区 的 高 端 向 下 增长 ， 
而 在 许多 的 系统 中 是 不 检测 溢出 的 。 由 于 有 太 多 同时 在 运行 着 的 函数 ， 用 尽 栈 空间 的 情况 
总 是 可 能 发 生 的 。 显 而 易 见 ， 用 尽 栈 空间 通常 是 致命 的 错误 。 

在 不 进行 栈 溢 出 检测 的 语言 和 系统 中 ， 程 序 将 会 衣 溃 而 没有 明显 的 说 明 。 在 这 些 系统 
中 ， 当 你 的 栈 太 大 时 会 发 生 一 些 奇怪 的 事情 ， 因 为 它 可 能 波及 部 分 程序 。 这 部 分 也 许 是 主 
程序 ， 也 许 是 数据 部 分 ， 特 别 是 当 使 用 大 的 数组 的 时 候 。 如 果 主 程序 发 生 栈 溢出 ， 那 么 程 
ERAH, 产生 一 些 无 意义 的 指令 并 在 这 些 指令 被 执行 时 程序 骨 演 。 如 果 数 据 部 分 
发 生 栈 溢出 ， 很 可 能 发 生 的 是 : 当 你 将 一 些 信息 写 入 你 的 数据 时 ， 这 些 信息 将 冲 毁 栈 的 信 
息 ( 很 可 能 是 返回 地 址 )， 那 么 你 的 程序 将 返回 到 某 个 奇怪 的 地 址 上 去 ， 从 而 程序 骨 溃 。 

在 正常 情况 下 不 应 该 越 出 栈 空间 ， 发 生 这 种 情况 通常 是 由 失控 递归 (忘记 基准 情形 ) 的 
指向 引起 的 。 另 一 方面 ， 某 些 完全 合法 并 且 表 面 上 无 害 的 程序 也 可 以 使 你 越 出 栈 空 间 。 
图 3-54 中 的 例 程 打印 一 个 链表 ， 该 例 程 完全 合法 ， 实 际 上 是 正确 的 。 它 正常 地 处 理 空 表 的 
基准 情形 ， 并 且 递 归 也 没 问 题 。 可 以 证 明 这 个 程序 是 正确 的 。 但 是 不 幸 的 是 ， 如 果 这 个 链 
表 含有 20 000 个 元 素 ， 那 么 就 有 表示 第 3 (E H)20 000 个 活动 记录 的 一 个 栈 。 典 型 的 情 
况 是 这 些 活 动 记录 由 于 它们 包含 全 部 信息 而 特别 庞大 ， 因 此 这 个 程序 很 可 能 要 越 出 栈 空 间 。 
(如 果 20 000 个 元 素 还 不 足以 使 程序 骨 演 ,那么 可 用 更 大 的 个 数 代替 它 。) 





/* Bad use of recursion: Printing a linked list */ 
/* No header */ 

void 

PrintList( List L ) 


7* Veh ifC L != NULL ) 
f= 2*/ PrintElement( L->Element ); 
fe 35^ PrintList( L->Next); 
} 
} 











图 3-54 递归 的 不 当 使 用 : 打印 一 个 链表 


这 个 程序 称 为 尾 递 归 (tail recursion) ， 是 使 用 递归 极端 不 当 的 例子 。 尾 递归 指 的 是 在 最 
后 一 行 的 递归 调用 。 尾 递归 可 以 通过 将 递归 调用 变 成 goto 语句 并 在 其 前 加 上 对 函数 每 个 
参数 的 赋值 语句 而 手工 消除 。 它 模拟 了 递归 调用 ， 因 为 没有 什么 需要 存储 ， 在 递归 调用 结 
束 之 后 ， 实 际 上 没有 必要 知道 存储 的 值 。 因 此 ,我们 就 可 以 带 着 在 一 次 递归 调用 中 已 经 用 
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过 的 那些 值 跳 转 到 函数 的 顶部 。 图 3-55 显示 改进 图 3-54 后 的 程序 。 记 住 ， 你 应 该 使 用 更 自 
SREY while 循环 结构 。 此 处 使 用 goto 是 为 了 说 明 编 译 器 如 何 自动 地 去 除 递归 。 

尾 递 归 的 去 除 是 如 此 简单 ， 以 致 某 些 纺 
译 器 能 够 自动 地 完成 。 但 是 即使 如 此 ， 最 好 | 7 Uses a mechanical translation */ o 
还 是 你 的 程序 中 别 这 样 用 。 Xt Oi no 

递归 总 能 被 彻底 除去 (编译 器 是 在 转变 成 | WimtListc List LO 
汇编 语言 时 完成 的 ) ， 但 是 这 么 做 是 相当 宛 长 | fro 





es " 
乏味 的 。 一 般 方法 是 要 求 使 用 一 个 栈 ， 而 且 HFCL t= NULL D 
仅 当 你 能 够 把 栈 的 大 小 限制 在 最 低 限 度 时 ， PrintElenentC L->Elenent ); 
这 个 方法 才 值得 一 用 。 我 们 将 不 对 此 做 进 一 , eo tor: 








步 的 详细 讨论 ， 只 是 指出 ， 虽 然 非 递归 程序 |! 
一 般 说 来 确实 比 等 价 的 递归 程序 要 快 ， 但 是 





图 3-55 不 用 递归 打印 一 个 表 ， 编 译 器 可 以 


速度 优势 的 代价 却 是 由 于 去 除 递归 而 使 得 程 Heic a MP e Na 
序 清晰 性 变 得 不 足 。 


3.4 队列 ADT 


像 栈 一 样 ， 队 列 Cqueue) 也 是 表 。 然 而 ， 使 用 队列 时 插入 在 一 端 进 行 而 删除 则 在 另 一 端 
进行 。 


3.4.1 队列 模型 


队列 的 基本 操作 是 Enqueue CA BO - 
它 是 在 表 的 末端 ( 叫 作 队 尾 (rear)) 插 入 一 个 
TH. 还 有 Dequeue (出 队 ) 一 一 它 是 删除 
(或 返回 ) 在 表 的 开头 ( 叫 作 队 头 (front)) 的 元 
3&. Bl 3-56 显示 一 个 队列 的 抽象 模型 。 











Dequeue(Q) 队列 O | 








图 3-56 ”队列 模型 
3.4.2 队列 的 数组 实现 


如 同 栈 的 情形 一 样 ， 对 于 队列 而 言 ， 任 何 表 的 实现 都 是 合法 的 。 像 栈 一 样 ， 对 于 每 一 
种 操作 ， 链 表 实 现 和 数组 实现 都 给 出 快速 的 O(1) 运 行 时 间 。 队 列 的 链表 实现 简单 明了 ， 留 
作 练 习 。 现 在 我 们 讨论 队列 的 数组 实现 。 

对 于 每 一 个 队列 数据 结构 ， 我 们 保留 一 个 数组 Queue [] URME Front 4I Rear, € 
们 代表 队列 的 两 端 。 我 们 还 要 记录 实际 存在 于 队列 中 的 元 素 的 个 数 Size。 所 有 这 些 信息 是 
作为 一 个 结构 的 一 部 分 ， 除 队列 例 程 本 身 外 通常 不 会 有 例 程 直接 访问 它们 。 下 图 表示 处 于 
某 个 中 间 状 态 的 一 个 队列 。 顺 便 指 出 ， 图 中 那些 空白 单元 有 着 不 确定 的 值 。 尤 其 是 前 三 个 
单元 含有 曾经 属于 该 队列 的 元 素 。 
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$12] 1 
| Front Rear | 


操作 应 该 是 很 清楚 的 。 为 了 使 一 个 元 素 X 入 队 ， 我 们 让 Size 和 Rear #1, ARB 
Queue [Rear] 王 X。 若 使 一 个 元 素 出 队 ， 我 们 置 返回 值 为 Queue [Front]，Size 减 1， 然 
后 使 Front 增 1。 也 可 能 有 其 他 的 策略 (将 在 后 面 讨 论 ) 。 现 在 论述 错误 的 检测 。 

这 种 实现 存在 一 个 潜在 的 问题 。 经 过 10 次 入 队 后 队列 似乎 是 满 了 ， 因 为 Rear 现在 
是 10， 而 下 一 次 再 人 队 就 会 是 一 个 不 存在 的 位 置 。 然 而 ， 队 列 中 也 许 只 存在 几 个 元 素 ， 
因为 若干 元 素 可 能 已 经 出 队 了 。 像 栈 一 样 ， 即 使 在 有 许多 操作 的 情况 下 队列 也 常常 不 是 
很 大 。 

简单 的 解决 方法 是 ， 只 要 Front 或 Rear 到 达 数 组 的 尾 端 ， 它 就 又 绕 回 到 开头 。 下 图 
显示 在 某 些 操作 期 间 的 队列 情况 。 这 叫 作 循环 数组 (circular array) 实 现 。 

实现 回 绕 所 需要 的 附加 代码 是 极 小 的 (虽然 它 可 能 使 得 运行 时 间 加 倍 ) 。 如 果 Front 或 
Rear 增 1 后 超越 了 数组 规定 的 大 小 ,那么 其 值 就 要 重 置 为 数组 的 第 一 个 位 置 。 
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经 过 Dequeue 并 返回 2 后 
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经 过 Dequeue 并 返回 4 后 











$43 2 | 4 








Front Rear 





经 过 Dequeue 并 返回 1 后 
3 | I 254 


Rear 
Front 








= 









































64 


数据 结构 与 算法 分 析 C 语言 描述 


经 过 Dequeue 并 返回 3 后 同时 使 队列 为 空 
eq Lil six 
Rear Front 


关于 队列 的 循环 实现 ， 有 两 件 事情 要 警惕 。 第 一 ， 检 测 队 列 是 否 为 空 是 很 重要 的 ， 因 
为 当 队 列 为 空 时 ， 一 次 Dequeue 操作 将 不 知 不 觉 地 返回 一 个 不 确定 的 值 。 第 二 ， 某 些 程序 
设计 人 员 使 用 不 同 的 方法 来 表示 队列 的 队 头 和 队 尾 。 例 如 ， 有 些 人 并 不 用 一 个 单元 来 表示 
队列 的 大 小 ， 因 为 他 们 依靠 的 是 基准 情形 ， 即 当 队 列 为 空 时 Rear 王 Front 一 1。 队 列 的 大 
小 是 通过 比较 Rear Al Front 隐 式 算出 的 。 这 是 一 种 非常 隐秘 的 方法 ， 因 为 存在 某 些 特殊 
的 情形 ， 因 此 ， 如 果 你 需要 修改 用 这 种 方式 编写 的 代码 ， 那 么 就 要 特别 仔细 。 如 果 队 列 的 
大 小 不 是 结构 的 一 部 分 ， 那么 耕 数 组 的 大 小 为 ASize， 则 当 存 在 ASize—1 个 元 素 时 队列 
就 满 了 ， 因 为 只 有 ASize 个 不 同 的 大 小 值 可 区 分 ， 而 0 是 其 中 的 一 个 。 采 用 任意 一 种 你 喜 
欢 的 风格 ， 但 要 确保 你 的 所 有 例 程 都 是 一 致 的 。 由 于 队列 的 实现 方法 有 多 种 选择 ， 因 此 如 
果 你 不 使 用 size 字段 ， 那 就 有 必要 在 代码 中 插入 一 些 注 释 。 

在 Enqueue 的 次 数 肯定 不 会 大 于 队列 的 大 小 的 应 用 中 ， 使 用 回 绕 是 没有 必要 的 。 像 栈 
一 样 ， 除 非 主 调 例 程 肯 定 队列 非 空 ， 和 否则 Dequeue 很 少 执行 。 因 此 对 这 种 操作 ， 只 要 不 是 
关键 的 代码 ， 错 误 的 调用 常常 被 跳 过 。 一 般 说 来 这 并 不 是 无 可 非议 的 ， 因 为 你 可 能 得 到 的 
时 间 节 省 量 是 极 小 的 。 ‘ 

我 们 通过 编写 某 些 队列 的 例 程 来 结束 本 节 ， 其 余 例 程 留 作 练习 。 首 先 ， 在 图 3-57 中 给 
出 队列 的 声明 。 正 如 对 于 栈 的 数组 实现 所 做 的 那样 ， 我 们 添加 一 个 最 大 大 小 的 域 。 还 需要 


#ifndef _Queue_h 


























struct QueueRecord; 
typedef struct QueueRecord *Queue; 


int IsEmpty( Queue Q ); 

int IsFull( Queue Q ); 

Queue CreateQueue( int MaxElements ); 
void DisposeQueue( Queue Q ); 

void MakeEmpty( Queue Q ); 

void Enqueue( ElementType X, Queue Q ); 
ElementType Front( Queue Q ); 

void Dequeue( Queue Q ); 

ElementType FrontAndDequeue( Queue Q ); 


#endif /* Queue h */ 


/* Place in implementation file */ 
/* Queue implementation is a dynamically allocated array */ 
#define MinQueueSize ( 5 ) 


struct QueueRecord 


int Capacity; 

int Front; 

int Rear; 

int Size; 
ElementType *Array; 











图 3-57 队列 的 类 型 声明 


提供 例 程 CreateQueue 和 DisposeQueue。 此 外 ,我们 还 要 提供 测试 一 个 队列 是 否 为 空 


的 例 程 以 及 构造 一 个 空 队 列 的 例 程 ( 见 图 3-58 和 
图 3-59) 。 读 者 可 以 编写 函数 IsFul1l1， 用 于 实现 
判断 队列 是 否 满 了 的 功能 。 注意，Rear 在 
Front 之 前 预 初始 化 为 1。 我 们 将 要 编写 的 最 后 
的 操作 是 Enqueue 例 程 。 严 格 遵循 上 面 的 描述 ， 
图 3-60 展示 了 队列 的 数组 实现 。 


3.4.3 队列 的 应 用 

有 几 种 使 用 队列 来 提高 运行 效率 的 算法 。 它 
们 当中 有 些 可 以 在 图 论 中 找到 ,我们 将 在 第 9 章 讨 
论 它们 。 这 里 ， 先 给 出 某 些 应 用 队列 的 例子 。 

当 作业 送 交 给 一 台 行 式 打 印 机 ， 它 们 就 按照 
到 达 的 顺序 排列 起 来 。 因 此 ， 送 往 行 式 打印 机 的 
作业 基本 上 被 放 到 一 个 队列 中 。- 

实际 生活 中 的 每 次 排队 都 (应 该 ) 是 一 个 队列 。 
例如 ， 在 元 些 售票 口 排列 的 队 都 是 队列 ,- 因 为 服 
务 的 顺序 是 先 到 的 先 买 票 。 

另 一 个 例子 是 关于 计算 机 网 络 的 。 有 许多 种 
PC 网 络 设置 ， 其 中 磁盘 是 放 在 一 台 叫 作文 件 服务 
器 的 机 器 上 的 。 使 用 其 他 计算 机 的 用 户 是 按照 先 
到 先 使 用 的 原则 访问 文件 的 ， 因 此 其 数据 结构 是 
—^ T. 

进一步 的 例子 如 下 : 

当 所 有 的 接线 员 忙 得 不 可 开交 的 时 候 ， 对 
大 公司 的 传呼 一 般 都 被 放 到 一 个 队列 中 。 
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int 
IsEmpty( Queue Q ) 
{ 


return Q->Size == 0; 





3-58 测试 队列 是 否 为 空 的 例 程 
一 一 数组 实现 





void 
MakeEmpty( Queue Q ) 
{ 


Q->Size = 0; 
Q->Front = 1; 
Q->Rear = 0; 


} 








图 3-59 构造 空 队列 的 例 程 一 一 数组 实现 








static int 
Succ( int Value, Queue Q ) 
{ 
ifC ++Value == Q->Capacity ) 
Value = 0; 
return Value; 


} 


void 
Enqueue( ElementType X, Queue Q ) 
{ 


ifC IsFull( Q ) ) 
Error( "Full queue" ); 
else 


Q->Size++; 
Q->Rear = Succ( Q->Rear, Q ); 
Q-»Array[ Q->Rear ] = X; 

} 





} 





图 3-60 入 队 的 例 程 一 一 数组 实现 


e 在 大 学 里 ， 如 果 所 有 的 终端 都 被 占用 ， 由 于 资源 有 限 ， 学 生 们 必须 在 一 个 等 待 表 上 
签字 。 在 终端 上 登录 时 间 最 长 的 学 生 将 首先 被 强制 离开 ， 而 等 待 时 间 最 长 的 学 生 则 


将 是 下 一 个 被 允许 使 用 终端 的 用 户 。 


处 理 用 概率 的 方法 计算 用 户 排队 预计 等 待 时 间 、 等 待 服务 的 队列 能 够 排 多 长 ， 以 及 其 
他 一 些 诸如 此 类 的 问题 将 用 到 被 称 为 排队 论 (queueing theory) 的 完整 数学 分 支 。 问 题 的 答 
案 依赖 于 用 户 加 入 队列 的 频率 以 及 一 旦 用 户 得 到 服务 时 处 理 服 务 花费 的 时 间 。 这 两 个 参数 
作为 概率 分 布 函 数 给 出 。 在 一 些 简 单 的 情况 下 ， 答 案 可 以 解析 算出 。 一 种 简单 的 例子 是 一 
条 电话 线 有 一 个 接线 员 。 如 果 接 线 员 忙 ， 打 来 的 电话 就 被 放 到 一 个 等 待 队列 中 (这 还 与 某 个 





O ”我们 说 基本 上 是 因为 作业 可 以 被 除去 。 这 等 于 从 队列 的 中 间 执 行 一 次 删除 ， 它 违反 了 队列 的 严格 定义 。 


o 
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容许 的 最 大 限度 有 关 )。 这 个 问题 在 商业 上 很 重要 ， 因 为 研究 表明 ， 人 们 会 很 快 挂 上 电话 。 
如 果 我 们 有 上 & 个 接线 员 ， 那么 这 个 问题 解决 起 来 要 困难 得 多 。 解 析 求 解困 难 的 问题 往 
往 使 用 模拟 的 方法 求解 。 此 时 ， 我 们 需要 使 用 一 个 队列 来 进行 模拟 。 如 果 上 很 大 ， 那 么 我 
们 还 需要 其 他 一 些 数据 结构 来 使 得 模拟 更 有 效 地 进行 。 在 第 6 章 将 会 看 到 模拟 是 如 何 进行 
的 。 那 时 我 们 将 对 & 的 若干 值 进 行 模拟 并 选择 能 够 给 出 合理 等 待 时 间 的 最 小 的 k。 
正如 栈 一 样 ， 队 列 还 有 其 他 丰富 的 用 途 ， 这样 一 种 简单 的 数据 结构 竞 然 能 够 如 此 重要 ， 
实在 令 人 惊奇 。 


Q 总 结 


本 章 描述 了 一 些 ADT 的 概念 ， 并 且 利 用 三 种 最 常见 的 抽象 数据 类 型 阐述 了 这 个 概念 。 
主要 目的 就 是 将 抽象 数据 类 型 的 具体 实现 与 它们 的 功能 分 开 。 程 序 必须 知道 操作 都 做 些 什 
么 ,但 是 如 果 不 知道 操作 是 如 何 实 现 的 实际 上 更 好 。 

表 、 栈 和 队列 或 许 在 全 部 计算 机 科学 中 是 三 个 基本 的 数据 结构 ， 大 量 的 例子 证 明了 它 
们 广 谤 的 用 途 。 特 别 地 ， 我 们 看 到 栈 是 如 何 用 来 记录 过 程 和 函数 调用 的 ， 以 及 递归 实际 上 
是 如 何 实现 的 。 理 解 这 些 过 程 是 非常 重要 的 ， 不 只 因为 它 使 得 过 程 语 言 成 为 可 能 ， 而 且 还 
因为 知道 递归 的 实现 从 而 消除 了 围绕 其 使 用 的 大 量 文 团 。 虽 然 递归 非常 强大 ,但 是 它 并 不 
是 完全 随意 的 操作 ; 递归 的 误 用 和 乱用 可 能 导致 程序 崩溃 。 , 


Q 练习 


3. 1 编写 打印 一 个 单 链 表 的 所 有 元 素 的 程序 。 

3.2 给 你 一 个 链表 工 和 另 一 个 链表 己 ， 它 们 包含 以 升序 排列 的 整数 。 操 作 PrintLots(L, 
P) 将 打印 工 中 那些 由 P 所 指定 的 位 置 上 的 元 素 。 例 如 ， 如 果 P—1, 3, 4, 6, BA, 
L 中 的 第 1、 第 3、 第 4 和 第 6 个 元 素 被 打印 出 来 。 写 出 程序 PrintLots(L, P). ff 
应 该 只 使 用 基本 的 表 操 作 。 该 程序 的 运行 时 间 是 多 少 ? 

3.3 通过 只 调整 指针 (而 不 是 数据 ) 来 交换 两 个 相 邻 的 元 素 ， 使 用 
a. 单 链表 。 
b. 双 链 表 。 

3.4 给 定 两 个 已 排序 的 表 Li 和 LL ， 只 使 用 基本 的 表 操 作 编 写 计 算 LL: 的 过 程 。 

3.5 给 定 两 个 已 排序 的 表 Li AL. ， 只 使 用 基本 的 表 操 作 编写 计算 Li UL: 的 过 程 。 

3.6 编写 将 两 个 多 项 式 相 加 的 函数 。 不 要 毁坏 输入 数据 。 用 一 个 链表 实现 。 如 果 这 两 个 多 
项 式 分 别 有 M 项 和 N 项 ， 那 么 你 的 程序 的 时 间 复 杂 度 是 多 少 ? 

3.7 编写 一 个 函数 将 两 个 多 项 式 相 乘 ， 用 一 个 链表 实现 。 你 必须 保证 输出 的 多 项 式 按 寡 次 
排列 并 且 最 多 有 一 项 为 任意 震 。 
a. 给 出 以 OU ) 时 间 求 解 该 问题 的 算法 。 
xb. 编写 一 个 以 OCM N) 时 间 执 行 乘法 的 程序 ， 其 中 M 是 具有 较 少 项 数 的 多 项 式 

的 项 数 。 





第 3 章 表 、 栈 和 队列 67 


xc. 编写 一 个 以 OCM N log (MN) ) 时 间 执 行 乘法 的 程序 
d. 上面 哪 个 算法 的 时 间 界 最 好 ? 
3.8 编写 一 个 程序 ， 输 入 一 个 多 项 式 F(X),， 计算 出 (F(X))”。 你 的 程序 的 时 间 复 杂 度 是 
多 少 ? 至 少 再 提出 一 种 对 F(X) 和 PP 的 某 些 可 能 的 选择 具有 竞争 性 的 解法 。 
3.9 编写 任意 精度 整数 运算 包 。 要 使 用 类 似 于 多 项 式 运算 的 方法 。 计 算 在 2 "内 数字 0 到 
9 的 分 布 。 
3.10 Josephus 问题 是 下 面 的 游戏 : N 个 人 从 1 到 NN 编号 ， 围 坐 成 一 个 圆圈 。 从 1 号 开始 
传递 一 个 热土 豆 。 经 过 M 次 传递 后 拿 着 热土 豆 的 人 被 请 除 离 座 ， 围 坐 的 圆圈 缩 紧 ， 
由 坐 在 被 请 除 的 人 后 面 的 人 拿 起 热土 豆 继 续 进行 游戏 。 最 后 剩 下 的 人 取胜 。 因此 ， 
如 果 M=0 和 N=5， 则 依次 请 除 后 ，5 号 获胜 。 如 果 M=1 和 NN 二 5， 那 么 被 清除 的 
人 的 顺序 是 2， 4, 1, 5, 
a. 编写 一 个 程序 解决 M 和 NN 在 一 般 值 下 的 Josephus 问题 ， 应 使 你 的 程序 尽 可 能 提 
高 高 效 ， 要 确保 能 够 清除 单元 。 
. 你 的 程序 的 运行 时 间 是 多 少 ? 
c. 如 果 M=1， 你 的 程序 的 运行 时 间 是 多 少 ?” 对 于 大 的 N(N>10 000), 其 free fl 
星 是 如 何 影 响 实际 速度 的 ? 
3. 11 编写 查找 一 个 单 链表 中 特定 元 素 的 程序 。 分 别 用 递归 和 非 递 归 方 法 实现 ， 并 比较 它 
们 的 运行 时 间 。 链 表 必 须 达 到 多 大 才能 使 得 使 用 递归 的 程序 崩 普 ? 
12 a. 编写 一 个 非 递归 程序 以 O(N) 时 间 反 转 单 链表 。 
xb。 使 用 常数 附加 空间 编写 一 个 程序 以 O(N) 时 间 反 转 单 链表 。 
3.13 ”利用 社会 安全 号 码 对 学 生 记 录 构 成 的 数组 排序 。 编 写 一 个 程序 进行 这 项 工作 ， 使 用 
具有 1000 个 桶 的 基数 排序 并 分 三 趟 进行 。 
3. 14 ”编写 一 个 程序 将 一 个 图 读 入 邻接 表 ， 使 用 
a. HEX 
b. 游标 
3.15 a. 写 出 自 调整 (self-adjusting) 表 的 数组 实现 。 自 调整 表 如 同一 个 规则 的 表 ， 但 是 所 
有 的 插入 都 在 表 头 进行 ， 当 一 个 元 素 被 Find 访问 时 ， 它 就 被 移 到 表 头 而 不 改变 
其 余 的 项 的 相对 顺序 。 
b. 写 出 自 调整 表 的 链表 实现 。 
*c， 设 每 个 元 素 都 有 其 被 访问 的 固定 概率 p;。 证 明 那 些 具 有 最 高 访问 概率 的 元 素 都 靠 
3.16 假设 我 们 有 一 个 基于 数组 的 表 A[0..N 一 1]， 并 且 我 们 想 要 删除 所 有 相同 的 元 素 。 
LastPosition 初始 值 为 N 一 1， 但 该 值 随 着 相同 元 素 被 删除 而 变 得 越 来 越 小 。 考 [86 | 
ER 3-61 中 的 伪 代 码 程 序 段 。Delete 删除 位 置 ;) 上 的 元 素 并 使 表 缩 小 
a. 解释 该 程序 是 如 何 进行 工作 的 。 
- 利用 一 般 的 表 操 作 重 写 这 个 过 程 。 
*c. A DH 则 这 个 程序 的 运行 时 间 是 多 少 ? 
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xc， 解 释 如 何 打印 出 错 信 息 


C 语言 描述 











/* 1*/ for(i = 0; i « LastPosition; i++ ) 
f= 24 jad +1; 
ge 3*/ while( j « LastPosition ) 
pE qe ifC ALi] 22 AE j 12 
ft 5*7 Delete( j 5; 
else 
7/9 6x j++; 
} 
图 3-61 从 表 中 删除 重复 元 素 的 例 程 一 一 数组 实现 


d. 使 用 链表 实现 的 运行 时 间 是 多 少 ? 
. 给 出 














GER: 见 第 7 3E.) 





用 元 素 间 的 比较 就 可 以 解决 该 问题 。 


证 明 : 如 果 人 允许 除 比 较 之 外 的 其 他 操作 ， 


一 个 算法 以 O(N log N) 时 间 解 决 该 问题 。 
. 证 明 : 如 果 只 使 用 比较 ， 那 么 解决 该 问题 的 任何 算法 都 需要 QUN log N) 次 比较 。 





并 且 这 些 关键 字 都 是 实数 ， 那 么 我 们 不 














不 同 于 我 们 已 经 给 出 的 删除 方法 ， 另 


种 是 使 





用 懒惰 删除 (lazy deletion) 的 方法 。 为 





了 删除 一 个 元 素 ， 我 们 只 标记 上 该 元 素 被 删除 (使 用 一 个 附加 的 位 域 )。 表 中 被 删除 





和 非 被 删除 元 素 的 个 数 作为 数据 结构 





的 一 部 分 被 保留 。 如 果 被 删除 元 素 和 非 被 删除 


元 素 一 样 多 ， 我 们 遍历 整个 表 ， 对 所 有 被 标记 的 节点 执行 标准 的 删除 算法 


a， 列 出 懒惰 删除 的 优点 和 缺点 。 





b. 编写 实现 使 用 懒惰 删除 的 标准 链表 操作 的 例 程 。 








用 下 列 语言 编写 检测 平衡 符号 的 程序 : 
a. Pascal (begin/end, (), L lx 1). 
b Eye 86 0). Dds gs 





o 





编写 一 个 程序 计算 后 缀 表达 式 的 值 。 








a. 编写 一 个 程序 将 中 组 表达 式 转换 成 后 
a CD 和 SE Ua 
b. 把 究 操 作 符 添加 到 你 的 指令 系统 中 。 





c. 编写 一 个 程序 将 后 级 表达 式 转换 成 中 缀 表达 式 。 
# 


编写 仅 用 一 个 数组 实现 两 个 栈 的 例 程 。 除 了 
栈 例 程 不 能 有 溢出 声明 。 











数组 的 每 一 个 单元 都 被 使 用 ， 否 则 你 的 














22 x a， 提 出 支持 栈 的 Push 和 Pop 操作 以 及 第 三 种 操作 FindMin 的 数据 结构 ， 其 中 FindMin 


229 


返回 该 数据 结构 的 最 小 元 素 ， 所 有 操作 在 最 坏 的 情况 下 的 运行 时 间 都 是 
xb 证明， 如果 我 们 加 入 第 四 种 操作 DeleteMin, PABDA— MR 








Q(log N) 时 间 ， 其 中 ，DeleteMin 找 
第 7 章 ) 
说 明 如 何 用 一 个 数组 实现 三 个 栈 。 


OU). 
芷 必须 人 花费 
出 并 删除 最 小 的 元 素 。( 本 题 需要 阅读 
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3.25 


3; 26 
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在 2.4 节 中 用 于 计算 斐 波 那 契 数 的 递归 例 程 如 果 在 N=50 下 运行 ， 栈 空间 有 可 能 用 
完 吗 ? 为 什么 ? 

编写 实现 队列 的 例 程 ， 使 用 

a. 链表 

b. 数组 

双 端 队列 (deque) 是 由 一 些 项 的 表 组 成 的 数据 结构 ， 对 该 数据 结构 可 以 进行 下 列 
操作 : 

Push(X, D): 将 项 XX 插入 到 双 端 队列 D 的 前 端 。 

Pop(D): 从 双 端 队列 D. 中 删除 前 端 项 并 将 其 返回 。 

Inject(X, D): 将 项 XX 插入 到 双 端 队列 DD 的 尾 端 。 

Eject(D): 从 双 端 队列 D 中 删除 尾 端 项 并 将 其 返回 。 

编写 支持 双 端 队列 的 例 程 ， 每 种 操作 均 花 费 O(1) 时 间 。 
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对 于 大 量 的 输入 数据 ， 链 表 的 线性 访问 时 间 太 慢 ， 不 宜 使 用 。 本 章 介绍 一 种 简单 的 数 
据 结构 ， 其 大 部 分 操作 的 运行 时 间 平 均 为 O(log N)。 我 们 还 会 简 述 对 这 种 数据 结构 在 概念 
上 的 简单 修改 ， 它 保证 了 在 最 坏 情 形 下 的 上 述 时 间 界 。 此 外 ， 还 讨论 了 第 二 种 修改 ， 对 于 
长 的 指令 序列 它 对 每 种 操作 的 运行 时 间 基 本 上 是 O(log ND. 

本 章 涉及 的 这 种 数据 结构 叫 作 二 又 查找 树 (binary search tree)。 在 计算 机 科学 中 树 
(tree) 是 非常 有 用 的 抽象 概念 ， 因 此 ， 我 们 将 讨论 树 在 其 他 更 一 般 的 应 用 中 的 使 用 。 

在 这 一 章 ， 我 们 将 : 

e 了 解 树 是 如 何 用 于 实现 几 个 流行 的 操作 系统 中 的 文件 系统 的 。 

e 看 旬 树 如 何 能 够 用 来 计算 算术 表达 式 的 值 。 

e 指出 如 何 利用 树 支 持 以 O(log N) 平 均 时 间 进 行 的 各 种 搜索 操作 ， 以 及 如 何 细 化 以 得 到 

最 坏 情况 时 间 界 O(log NO 。 我 们 还 将 讨论 当 数 据 存储 在 磁盘 上 时 如 何 来 实现 这 些 操作 。 


4.1 预备 知识 


树 (tree) 可 以 用 几 种 方式 定义 。 定 义 树 的 一 种 自然 的 方式 是 递归 方法 。 一 棵 树 是 一 些 节 
点 的 集合 。 这 个 集合 可 以 是 空 集 ; 若非 空 ， 则 一 棵 树 由 称 作 根 (root) 的 节点 7 以 及 0 个 或 多 
AES (POET. T. s T, 组 成 ,这些 子 树 中 每 一 棵 的 根 都 被 来 自 根 + 的 一 条 有 向 的 
边 (edge) 所 连接 。 

每 一 棵 子 树 的 根 叫 作 根 7 的 儿子 (child)， 而 + 是 每 一 棵 子 树 的 根 的 父亲 (parent)。 
图 4-1 显示 用 递归 定义 的 典型 的 树 。 





/ T. \ if f T, 3 ^ 1 -一 AN T 3 2 Tio 
4-1 一 般 的 树 


从 递归 定义 中 我 们 发 现 ， 一 棵 树 是 N 个 节点 和 NN 一 1 条 边 的 集合 ， 其 中 的 一 个 节点 叫 
作 根 。 存 在 N 一 1 条 边 的 结论 是 由 下 面 的 事实 得 出 的 ， 每 条 边 都 将 某 个 节点 连接 到 它 的 父 
亲 ， 而 除去 根 节点 外 每 一 个 节点 都 有 一 个 父亲 ( 见 图 4-2)。 


a LA). 
By Cy (Dj (E (F) G 
[ "ie qo 
/ \ 
H) (1 J K) (L) (M N 
P) (Q) 


图 4-2 一 棵 具体 的 树 


在 图 4-2 的 树 中 ， 节 点 A 是 根 。 节 点 下 有 一 个 父亲 A 并 且 有 儿子 K、L 和 M。 每 一 个 节 
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点 可 以 有 任意 多 个 儿子 ， 也 可 能 是 零 个 儿子 。 没 有 儿子 的 节点 称 为 树叶 (leaf);， 上 图 中 的 树叶 
是 B、C、H、 I、P、Q、K、L、M 和 N。 具 有 相同 父亲 的 节点 为 兄弟 (sibling); KWE, K, I 
和 M 都 是 兄弟 。 用 类 似 的 方法 可 以 定义 祖父 (grandparent) 和 孙子 (grandchild) 关 系 。 

WA m $m, ups meio: m, m, c. m 的 一 个 序列 ， 使 得 对 于 0x. 
节点 五 是 ni41 的 父亲 。 这 个 路 径 的 长 (length) 为 该 路 径 上 边 的 条 数 ， 即 一 1。 从 每 一 个 节点 到 
ee er 注意 ， 在 一 棵 树 中 从 根 到 每 个 节点 恰好 存在 一 条 路 径 。 

对 任意 节点 nio n; 的 深度 (depth) 为 从 根 到 nn; 的 唯一 路 径 的 长 。 因 此 ， 根 的 深度 为 0。 
n; 的 高 (height) 是 从 nn; 到 一 片 树叶 的 最 长 路 径 的 长 。 因 此 所 有 的 树叶 的 高 都 是 0。 一 棵 树 的 
高 等 于 它 的 根 的 高 。 对 于 图 4-2 中 的 树 ，E 的 深度 为 1 而 高 为 2; F 的 深度 为 1 而 高 也 是 1; 
该 树 的 高 为 3。 一 棵 树 的 深度 等 于 它 的 最 深 的 树叶 的 深度 ; 该 深度 总 是 等 于 这 棵 树 的 高 。 

如 果 存 在 从 nn 到 ns WR, IA nm AE ns 的 一 位 祖先 (ancestor) 而 ns 是 的 一 个 
K & (descendant), WÈ m Em, PBA n; 是 ns 的 一 位 真 祖先 (proper ancestor) fi n: fim, 的 
— 4S fS d (proper descendant) , 


4.1.1 树 的 实现 


实现 树 的 一 种 方法 可 以 是 在 每 一 个 节点 除数 据 -一 
外 还 要 有 -一些 指针 使 得 该 节 " 的 每 一 个 儿子 都 有 typedef struct TreeNode *PtrToNode; 
一 个 指针 指向 它 。 然 而 ， 由 于 每 个 节点 的 儿子 数 可 HEE Treo 

以 变化 很 大 并 且 事先 不 知道 ， 因 此 在 数据 结构 中 建 PerToNode ^ FirstChild; 

立 到 各 儿子 节点 的 直接 链接 是 不 可 行 的 ， 因 为 这 样 | p “Men 











会 浪费 太 多 的 空间 。 实 际 上 解法 很 简单 将 每 个 节 一 ee 





点 的 所 有 儿子 都 放 在 树 节 点 的 链表 中 。 图 4-3 中 的 声 图 4-3 树 的 节点 声明 
明 就 是 典型 的 声明 。 


图 4-4 显示 一 棵 树 可 以 用 这 种 实现 方法 表示 出 来 。 图 中 向 下 的 箭头 是 指向 FirstCh- 
ild( 第 一 儿子 ) 的 指针 。 从 左 到 右 的 第 头 是 指向 NextSibling( 下 一 兄弟 ) 的 指针 。 因 为 空 
指针 太 多 ， 所 以 没有 画 出 它们 。 





8) 
(B. —— (0) ——— D WE BP 3G 
t m d = Aa ~ 
A O D-H W 
D e € D 8 G 
E t 
OSO 











图 4-4 在 图 4-2 中 所 表示 的 树 的 第 一 儿子 /下 一 兄弟 的 表示 法 


在 图 4-4 的 树 中 ， 节 点 有 一 个 指针 指向 兄弟 (F)， 男 一 指针 指向 儿子 (1)， 而 有 的 节 
点 这 两 种 指针 都 没有 。 
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4.1.2 树 的 遍历 及 应 用 


树 有 很 多 应 用 。 流 行 的 用 法 之 一 是 包括 UNIX, VAX/VMS 和 DOS 在 内 的 许多 常用 操 
作 系 统 中 的 目录 结构 。 图 4-5 是 UNIX 文件 系统 中 一 个 典型 的 目录 。 

这 个 目录 的 根 是 /usr。( 和 名字 后 面 的 星 号 指出 /usr 本 身 就 是 一 个 目录 。)/usr 有 三 个 
JLF: mark、alex 和 bil1， 它 们 自己 也 都 是 目录 。 因 此 ，/ust 包含 三 个 目录 而 且 没 有 
正规 的 文件 。 文 件 名 /usr/mark/book/chl.r 先后 三 次 通过 最 左边 的 儿子 节点 而 得 到 。 在 
PREIS ae “/” 都 表示 一 条 边 ; 结果 为 一 全 路 径 名 。 这 个 分 级 文件 系统 非常 流行 ， 

它 能 够 使 得 用 户 逻 辑 地 组 织 数据 。 不 仅 如 此 ， 在 不 同 目 录 下 的 两 个 文件 还 可 以 享有 相 
oe 因为 它们 必然 有 从 根 开 始 的 不 同 的 路 径 从 而 具有 不 同 的 路 径 名 。 在 UNIX 文件 
系统 中 的 目录 就 是 含有 它 的 所 有 儿子 的 一 个 文件 ， 因 此 ， 这 些 目录 几乎 是 完全 按照 上 述 的 
类 型 声明 构造 的 ? 。 事 实 上， 如 果 将 打印 一 个 文件 的 标准 命令 应 用 到 一 个 目录 上 ， 那 么 在 该 
目录 中 的 这 些 文件 名 能 够 在 (与 其 他 非 ASCI 信息 一 起 的 ) 输 出 中 看 到 。 


/usr* 


m sce E 

mark* alex* Pill* 

: ^ | ~ 

book* course*  junkc — junkc ^ work* course* 
ge ee | 
chir  ch2r  ch3r cop3530* cop3212* 4 

9 tas E si iac m 

fallóó* - spr97* sum97* fall96* fall97* 

A 
| | E t, m we 
syl.r sylr sylr grades progl.r prog2.r prog2r  progl.r Phiten 


4-5 UNIX 目录 


假设 我 们 想 要 列 出 目录 中 所 有 文件 
的 名 字 。 我 们 的 输出 格式 将 是 : 深度 为 Da DeaconvdRbi Te D, int Depth ) 
d, 的 文件 的 名 字 将 被 d. 次 跳 格 (tab) 缩 /* 1*/ ! if( D is a legitimate entry ) 


AEN DONGEHERDA-5 HH. | ever | ppt D, Depth Ja 














算法 的 核心 为 递归 程序 ListDir. | f= ay for each child, C, of D 
为 了 显示 根 时 不 进行 缩 进 ， 该 例 程 需要 | C7 70 iti IOS LIS 
从 目录 名 和 深度 0 开始 。 这 里 的 深度 是 
一 个 内 部 敌 记 变量 ， 而 不 是 主 调 例 程 能 Oe 
够 期 望 知道 的 那 种 参数 。 因 此 ， 了 驱动 例 T S 
fé ListDirectory 用 于 将 递归 例 程 和 } 

外 界 连接 起 来 。 


算法 逻辑 简单 易 懂 的 参 图 4-6 列 出 分 级 文件 系统 中 目录 的 例 程 
i IH TR. ListDir HJZ 


数 是 到 树 中 的 某 种 引用 。 只 要 引用 合理 ， 则 引用 涉及 的 名 字 在 进行 适当 次 数 的 跳 格 缩 进 后 





Q 在 UNIX 文 件 系 统 中 每 个 目录 还 有 一 项 指向 该 目录 本 身 以 及 另 一 项 指向 该 目录 的 父 目 录 。 因 此 ， 严 格 说 来 ， 
UNIX 文 件 系 统 不 是 树 ， 而 是 类 树 (treelike) 。 


被 打印 出 来 。 如 果 是 一 个 目录 ， 那 么 我 们 递归 地 一 个 一 个 地 处 理 它 所 有 的 儿子 。 这 些 儿 子 
处 在 一 个 深度 上 ， 因 此 需要 缩 进 一 段 附加 的 空格 。 整 个 输出 如 





图 4-7 所 示 。 sa 

这 种 遍历 的 策略 叫 作 先 序 遍 历 (preorder traversal), fE lc JF Wi eure 
历 中 ， 对 节点 的 处 理工 作 是 在 它 的 诸 儿子 节点 被 处 理 之 前 进行 
的 。 当 该 程序 运行 时 ， 显 然 如 图 4-6 所 示 ， 第 2 行 对 每 个 节点 恰 iu EN 
好 执行 一 次 ， 因 为 每 个 名 字 只 输出 一 次 。 由 于 第 2 行 对 每 个 节点 joe e 
最 多 执行 一 次 ， 因 此 第 3 行 也 必须 对 每 个 节点 执行 一 次 。 不 仅 如 sie ip 
此 ， 对 于 每 个 节点 的 每 一 个 儿子 节点 第 5 行 最 多 只 能 执行 一 次 。 
不 过 ， 儿 子 的 个 数 恰好 比 节点 的 个 数 少 1。 最 后 ,第 5 行 每 执行 | QUT 
一 次 ，for 循环 就 迭代 一 次 ， 每 当 循环 结束 时 再 执行 一 次 。 每 个 | pi s 











for 循环 终止 在 NULL 指针 上 ， 但 每 个 节点 最 多 有 一 个 这 样 的 指 
针 。 因 此 ， 每 个 节点 总 的 工作 量 是 常数 。 如 果 有 N 个 文件 名 需要 Pa 196 
输出 ， 则 运行 时 间 就 是 ON). eae 
男 一 种 遍历 树 的 方法 是 后 序 遍 历 (postorder traversal), TE TT cd 
后 序 遍 历 中 ， 在 一 个 节点 处 的 工作 是 在 它 的 诸 儿 子 节点 被 计算 a 
后 进行 的 。 例 如 ， 图 4-8 表示 的 是 与 前 面相 同 的 目录 结构 ， 其 grades 
中 圆 括 号 内 的 数 代表 每 个 文件 占用 的 磁盘 区 块 (disk block) fff 
个 数 图 4-7 目录 ( 先 序 ) 列 表 
/AD 
E alex*(l ; AM 1) 
ee cii Wi i 
book*(1) course*(1) junk.c(6) junk.c(8) work*(1) course*(1) 
chl1.r(3) ch2.r(2) ch3.r(4) cop3530*(1) eee 1) 
fall96* «(0 uem *(1) fall") Y alij *(1) 
| Ns e wes 


- 5 1) syl.r(5) syl. r(2) grades) progl KA) prog: r(1) prog2.r(2) progl.r(7) grades(9) 
图 4-8 经 由 后 序 遍历 得 到 的 具有 文件 大 小 的 UNIX 目录 


由 于 目录 本 身 也 是 文件 ， 因 此 它们 也 有 大 小 。 设 我 们 想 要 计算 被 该 树 所 有 文件 占用 的 
磁盘 区 块 的 总 数 。 最 自然 的 做 法 是 找 出 含 于 子 目 录 “/usr/mark (30)”“/usr/alex(9)” 
和 “/usr/bill (32)” 中 的 块 的 个 数 。 于 是 ， 磁 盘 块 的 总 数 就 是 子 目录 中 的 块 的 总 数 (71) 
加 上 “/usr” 使 用 的 一 个 块 ， 共 72 个 块 。 图 4-9 中 的 函数 SizeDirectory 实现 这 种 遍历 
策略 。 

如 果 了 D 不 是 一 个 目录 ， 和 那么 SizeDirectory 只 返回 D 所 占用 的 块 数 。 否 则 ， 将 
被 也 占用 的 块 数 与 其 所 有 子 节 点 (递归 地 ) 发 现 的 块 数 相 加 。 为 了 区 别 后 序 遍 历 策 略 和 
先 序 遍 历 策略 之 间 的 不 同 ， 图 4-10 显示 每 个 目录 或 文件 的 大 小 是 如 何 由 该 算法 产 
生 的 。 
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static void 
SizeDirectory( DirectoryOrFile D ) 
i 
int TotalSize; 
FP ay TotalSize = 0; 
JE 2*/ if( D is a legitimate entry ) 
{ 
fe Sy: TotalSize = FileSize( D ); 
f* 4X/ ifC D is a directory ) 
7E 5*/ for each child, C, of D 
f 68/ TotalSize += SizeDirectory( C ); 
} 
y p return TotalSize; 
} 








4-9 计算 一 个 目录 大 小 的 例 程 





chil. 3 
ch2 or 2 
ch3.r 4 
book 10 
syl.r di 
fa1196 2 
syl.r 5 
spr97 6 
syl.r 2 
Sum97 3 
cop3530 12 

course 13 4 
junk.c 6 
mark 30 
junk.c 8 
alex 9 
work L 
grades 3 
progl.r 4 
prog2.r 1 
fall96 9 
prog2.r 2 
progl.r 7 
grades 9 
fal197 19 
cop3212 29 
course 30 
bill 32 
/usr 72 











4-10 MW SizeDirectory 的 轨迹 


4.2 NW 


=X # (binary tree) 是 一 棵 树 ， 其 中 每 个 节点 的 儿子 都 不 能 多 于 两 个 。 

图 4-11 显示 一 棵 由 一 个 根 和 两 棵 子 树 组 成 的 二 叉 树 ，Ti 和 Te 均 可 能 为 空 。 

二 叉 树 的 一 个 性 质 是 平均 二 又 树 的 深度 要 比 N 小 得 多 ， 这 个 性 质 有 时 很 重要 。 分 析 表 
明 ， 这 个 平均 深度 为 O(VN)， 而 对 于 特殊 类 型 的 二 叉 树 ， 即 二 又 查找 树 (binary search 
tree)， 其 深度 的 平均 值 是 O(log NO, BMA, WA 4-12 所 示 ， 这 个 深度 是 可 以 大 到 
N-1. 


第 4 章 树 77 


oo P 
e 














2 T 7 i 
A r ® 
图 4-11 一 般 二 叉 树 图 4-12 最 坏 情况 的 二 又 树 
42.1 实现 
因为 一 棵 二 叉 树 最 多 有 两 个 儿子 ， 所 
typedef struct TreeNode *PtrToNode; 
以 我 们 可 以 用 指针 直接 指向 它们 。 树 节点 typedef struct PtrToNode Tree; 
的 声明 在 结构 上 类 似 于 双 链 表 的 声明 ， 在 struct TreeNode 
<i UNITS { 
声明 中 ， 一 个 节点 就 是 由 Key (关键 字 ) 信 ElementType Element; 
T Left; 
息 加 上 两 个 指向 其 他 节点 的 指针 (Left 和 Tree Right; 
Right) 组 成 的 结构 ( 见 图 4-13). i 


到 树 上 。 特 别 地 ， 当 进行 一 次 插入 时 ， 必 
须 调 用 malloc 创建 一 个 节点 。 节 点 可 以 在 调用 free 删除 后 释放 。 
我 们 可 以 用 在 画 链表 时 常用 的 矩形 框 画 出 二 叉 树 ， 但 是 ， 树 一 般 画 成 圆圈 并 用 一 些 直 | 95 
线 连接 起 来 ， 因 为 二 叉 树 实际 上 就 是 图 (graph)。 当 涉及 树 时 ,我 们 也 不 显 式 地 画 出 NULL | 
指针 ， 因 为 具有 N 个 节点 的 每 一 棵 二 又 树 都 将 需要 N 十 1 个 NULL 指针 。 ET 
二 又 树 有 许多 与 搜索 无 关 的 重要 应 用 。 二 叉 树 的 主要 用 处 之 一 是 在 编译 器 的 设计 领域 ， 
我 们 现在 就 来 探索 这 个 问题 。 


4.2.2 表达 式 树 
图 4-14 表示 一 个 表达 式 树 (expression s. 
tree) BET, eis CRE AA EI AR ERE G ee 
(operand), ， 比 如 常数 或 变量 ， 而 其 他 的 六 Gf m 
点 为 操作 符 (operator)。 由 于 这 里 所 有 的 操 (Sf Ye) 
作 都 是 二 元 的 ， 因 此 这 棵 特定 的 树 正 好 是 © f 


二 叉 树 ， 虽 然 这 是 最 简单 的 情况 ， 但 是 节 
点 含有 的 儿子 还 是 有 可 能 多 于 两 个 的 。 一 图 4-14 “(atbxc)+((dxett)*g)” 的 表达 式 树 
个 节点 也 有 可 能 只 有 一 个 儿子 ， 如 具有 一 目 减 算 符 (unary minus operator) 的 情形 。 可 以 将 
通过 递归 计算 左 子 树 和 右 子 树 所 得 到 的 值 应 用 在 根 处 的 算 符 操作 中 而 算出 表达 式 树 工 的 值 。 
在 我 们 的 例 中 ， 左 子 树 的 值 是 “a 十 (bx c)”， 右 子 树 的 值 是 “((d x e) 十 f) x g”， 因 此 整 棵 树 
Pm "Cad- Cb * e)» -- CCCd * e -D * g)”。 
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我 们 可 以 通过 递归 产生 一 个 带 括号 的 左 表 达 式 ， 然 后 打印 出 在 根 处 的 运算 符 ， 最 后 再 
递归 地 产生 一 个 带 插 号 的 右 表 达 式 而 得 到 一 个 (对 两 个 括号 整体 进行 运算 的 ) 中 缀 表达 式 (in- 
fix expression) 。 这 种 一 般 的 方法 ( 左 ， 节 点 ， 右 ) 称 为 中 序 遍 历 (inorder traversal); 由 于 其 


产生 的 表达 式 类 型 ， 这 种 遍历 很 容易 记忆 。 


另 一 个 遍历 策略 是 递归 打印 出 左 子 树 、 右 子 树 ， 然 后 打印 运算 符 。 如 果 我 们 应 用 这 种 
策略 于 上 面 的 树 ， 则 输出 将 是 “ab cx 十 d ex f 十 gx* 十 ”， 容 易 看 出 ， 它 就 是 3. 3. 3 节 中 的 
后 组 表达 式 。 这 种 遍历 策略 一 般 称 为 后 序 遍 历 (postorder traversal) 。 我 们 稍 早已 在 4.1 节 


中 见 过 这 种 排序 策略 。 


第 三 种 遍历 策略 是 先 打印 出 运算 符 ， 然后 递归 地 打印 出 右 子 树 和 左 子 树 。 其 结果 
“十 十 ax bex 十 x defg” 是 不 太 常 用 的 前 组 (prefix) 记 法 ， 这 种 遍历 策略 为 先 序 遍 历 (preor- 
der traversal) ， 稍 早 我 们 也 在 4.1 节 中 见 过 它 。 以 后 ,我们 还 要 在 本 章 讨 论 这 些 遍 历 策略 。 


构造 一 棵 表达 式 树 


我 们 现在 给 出 一 种 算法 来 把 后 级 表达 式 转 变 成 表达 式 树 。 由 于 我 们 已 经 有 了 将 中 缀 表达 
式 转变 成 后 缀 表达 式 的 算法 ， 因 此 我 们 能 够 从 这 两 种 常用 类 型 的 输入 生成 表达 式 树 。 所 描述 
的 方法 酷似 3. 2. 3 节 的 后 缀 求 值 算法 。 一 次 一 个 符号 地 读 入 表达 式 。 如 果 符 号 是 操作 数 ， 那 么 
我 们 就 建立 一 个 单 节点 树 并 将 一 个 指向 它 的 指针 推 人 栈 中 。 如 果 符 号 是 操作 符 ， 那 么 我 们 就 
从 栈 中 弹出 指向 两 棵 树 T 和 T 的 那 两 个 指针 (TT 的 先 弹出 ) 并 形成 一 棵 新 的 树 ， 该 树 的 根 就 


是 操作 符 ， 它 的 左 、 右 儿子 分 别 指向 T 和 T 。 然 后 将 指向 这 棵 新 树 的 指针 压 人 栈 中 。 
来 看 一 个 例子 。 设 输入 为 : 
abrede--® * 
前 两 个 符号 是 操作 数 ， 因 此 我 们 创建 两 棵 单 节点 树 并 将 指向 它们 的 指针 压 和 人 栈 中 .8 


Leld 
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EARP. 














O ”为 了 方便 起 见 ， 我 们 将 让 图 中 的 栈 从 左 到 右 增长 。 


接着 ， 读 入 “十 ”， 因 此 弹出 指向 这 两 棵 树 的 指针 ， 一 棵 新 的 树 形 成 ， 而 将 指向 该 树 的 指针 
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然后 ， 读 入 ec、d 和 e， 在 每 棵 单 节点 树 创 建 后 ， 将 指向 对 应 的 树 的 指针 压 人 栈 中 。 








接 下 来 读 和 人 “十 ”， 因 此 两 棵 树 合并 。 





























最 后 ， 读 入 最 后 一 个 符号 ， 两 棵 树 合并 ， 而 指向 最 后 的 树 的 指针 留 在 栈 中 。 
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4.3 查找 树 ADT—— - X frJE BI 


二 叉 树 的 一 个 重要 的 应 用 是 它们 在 查找 中 的 使 用 。 假 设 给 树 中 的 每 个 节点 指定 一 个 关 
键 字 值 。 在 我 们 的 例子 中 ， 虽 然 任意 复杂 的 关键 字 都 是 允许 的 ， 但 为 简单 起 见 ， 假 设 它们 
都 是 整数 。 我 们 还 将 假设 所 有 的 关键 字 是 互 异 的 ， 以 后 再 处 理 有 重复 的 情况 。 

使 二 又 树 成 为 二 又 查找 树 的 性 质 是 ， 对 于 树 中 的 每 个 节点 X， 它 的 左 子 树 中 所 有 关键 
字 值 小 于 X 的 关键 字 值 ， 而 它 的 右 子 树 中 所 有 关键 字 值 大 于 X 的 关键 字 值 。 注 意 ， 这 意味 
着 ,该 树 所 有 的 元 素 可 以 用 某 种 统一 的 方式 排序 。 在 图 4-15 中 ， 左 边 的 树 是 二 又 查找 树 ， 
但 右边 的 树 则 不 是 。 右 边 的 树 在 其 关键 字 值 是 6 的 节点 (该 节点 正好 是 根 节点 ) 的 左 子 树 中 ， 
有 一 个 节点 的 关键 字 值 是 7。 
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图 4-15 两 棵 二 叉 树 ( 只 有 左边 的 树 是 查找 树 ) 


现在 给 出 通常 对 二 又 查找 树 进 行 的 
操作 的 简要 描述 。 注 意 ， 由 于 树 的 递归 
定义 ， 通 常 是 递归 地 编写 这 些 操作 的 例 
程 。 因 为 二 叉 查 找 树 的 平均 深度 是 
OClog N)， 所 以 我 们 一 般 不 必 担 心 栈 空 
间 被 用 尽 。 在 图 4-16 中 我 们 重复 类 型 定 
义 并 列 出 函数 的 一 些 性 质 。 由 于 所 有 的 
元 素 都 是 有 序 的 ， 因 此 ， 虽 然 对 某 些 类 
型 也 许 会 出 现 语法 错误 ， 但 我 们 还 是 要 
BEARN —" "U" RU "—" RID] | jw piace in the implementation file */ 


s — struct TreeNode 
于 这 些 元 素 。 { 


ElementType Element; 
SearchTree Left; 
SearchTree Right; 





#ifndef _Tree_H 

struct TreeNode; 

typedef struct TreeNode *Position; 

typedef struct TreeNode *SearchTree; 

SearchTree MakeEmpty( SearchTree T ); 

Position Find( ElementType X, SearchTree T ); 
Position FindMin( SearchTree T ); 

Position FindMax( SearchTree T ); 

SearchTree Insert( ElementType X, Searchiree T ); 
SearchTree Delete( ElementType X, SearchTree T ); 
ElementType Retrieve( Position P ); 


#endif /* Tree H */ 


4.3.1 MakeEmpty 


这 个 操作 主要 用 于 初始 化 。 有 些 程 
序 设 计 人 员 更 愿意 将 第 一 个 元 素 初 始 化 
为 单 节点 树 ， 但 是 ， 我 们 的 实现 方法 更 紧密 地 遵循 树 的 递归 定义 。 正 如 图 4-17 中 显示 的 ， 
它 是 一 个 简单 的 例 程 。 











图 4-16 二 叉 查找 树 声 阴 


4.3.2 Find 


这 个 操作 一 般 需要 返回 指向 树 工 中 具有 关键 字 X 的 节点 的 指针 ， 如 果 这 样 的 节点 不 存 


在 则 返回 NULL。 树 的 结构 使 得 这 种 操作 很 简单 。 如 
果 了 是 NULL， 那 么 我 们 可 以 就 返回 NULL. fij. 
如 果 存 储 在 工 中 的 关键 字 是 X， 那 么 我 们 可 以 返回 
T. 否则 ， 我 们 对 树 工 的 左 子 树 或 右 子 树 进行 一 次 递 
归 调 用 ， 这 依赖 于 X 与 存储 在 工 中 的 关键 字 的 关系 。 
图 4-18 中 的 代码 就 是 对 这 种 策略 的 一 种 体现 。 

注意 测试 的 顺序 。 关 键 的 问题 是 首先 要 对 是 否 
为 空 树 进行 测试 ， 否 则 就 可 能 在 NULL 48 fF b UR al 
子 。 其 余 的 测试 应 该 使 得 最 不 可 能 的 情况 安排 在 最 
后 进行 。 还 要 注意 ， 这 里 的 两 个 递归 调用 事实 上 都 是 
尾 递 归并 且 可 以 很 容易 地 用 一 次 赋值 和 一 个 goto if 
名 代替 。 尾 递归 的 使 用 在 这 里 是 合理 的 ， 因 为 算法 表 
达 式 的 简明 性 是 以 速度 的 降低 为 代价 的 ， 而 这 里 所 使 
用 的 栈 空间 也 只 不 过 是 O(log N) 而 已 。 


4.3.3  FindMin 和 FindMax 

这 些 例 程 分 别 返 回 树 中 最 小 元 和 最 大 元 的 位 置 。 
虽然 返回 这 些 元 素 的 准确 值 似乎 更 合理 ,但 是 这 将 与 
Find 操作 不 相 容 。 重要 的 是 ， 看 起 来 类 似 的 操作 做 
的 工作 也 是 类 似 的。 为 执行 FingMin， 从 根 开始 并 
且 只 要 有 左 儿 子 就 向 左 进行 。 终 止 点 是 最 小 的 元 素 。 
FindMax 例 程 除 分 支 朝向 右 儿 子 外 其 余 过 程 相 同 。 

这 种 递归 是 如 此 容易 以 至 于 许多 程序 设计 员 不 厌 
其 烦 地 使 用 它 。 我 们 用 两 种 方法 编写 这 两 个 例 程 ， 用 
递归 编写 FindqMin， 而 用 非 递归 编写 FindqMax( 见 
图 4-19 和 图 4-20) 。 

注意 我 们 是 如 何 小 心地 处 理 空 树 这 种 退化 情况 
的 。 虽 然 小 心 总 是 重要 的 ， 但 在 递归 程序 中 它 尤 其 重 








SearchTree 
MakeEmpty( SearchTree T ) 
{ 

ifC T t= NULL ) 


MakeEmpty( T-»Left ); 
MakeEmpty( T->Right ); 
free( T ); 


} 
return NULL; 
} 








4-17 建立 一 棵 空 树 的 例 程 








Position 
Find( ElementType X, SearchTree T ) 


{ 


if( T == NULL ) 

return NULL; 
if( X < T->Element ) 

return Find( X, T->Left ); 
else 
if( X > T->Element ) 

return Find( X, T->Right ); 
else 

return T; 








4-18 二 叉 查 找 树 的 Find 操作 








Position 
FindMin( SearchTree T ) 
{ 


ifC T == NULL ) 
return NULL; 
else 
if( T->Left == NULL ) 
return T; 
else 
return FindMin( T->Left ); 
} 








图 4-19 对 二 义 查 找 树 的 FindMin 
的 递归 实现 


要 。 此 外 ， 还 要 注意 ,在 FindMax 中 对 工 的 改变 是 安全 的 ， 因 为 我 们 只 用 拷贝 来 进行 工 
作 。 不 管 怎么 说 ， 还 是 应 该 随时 特别 小 心 ， 因 为 诸如 “T->Right= T->Right->Right” 


这 样 的 语句 将 会 产生 一 些 变化 。 


4.3.4 Insert 


进行 插入 操作 的 例 程 在 概念 上 是 简单 的 。 为 了 将 X 搬入 到 树 了 中， 你 可 以 像 用 Fina 
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那样 沿 着 树 查找 。 如 果 找 到 X， 则 什么 也 不 用 做 (或 做 一 些 


“更 新 ”)。 否 则 ,将 XX 插入 到 遍 





历 的 路 径 上 的 最 后 一 点 上 。 图 4-21 显示 实际 的 插入 情 
况 。 为 了 插入 5， 我们 遍历 该 树 就 像 在 运行 Fina 一 
样 。 在 具有 关键 字 4 的 节点 处 ， 我 们 需要 向 右 行进 ， 
但 右边 不 存在 子 树 ， 因 此 5 不 在 这 棵 树 上 ， 从 而 这 个 
位 置 就 是 所 要 插入 的 位 置 。 

重复 元 的 插入 可 以 通过 在 节点 记录 中 保留 一 个 附 





Position 
FindMax( SearchTree T ) 
{ 
ifC T != NULL ) 
while( T->Right != NULL ) 
T = T->Right; 


return T; 


} 





加 域 以 指示 发 生 的 频率 来 处 理 。 这 使 整 棵 树 增加 了 某 
些 附加 空间 ， 但 是 ， 却 比 将 重复 信息 放 到 树 中 要 好 ( 它 
将 使 树 的 深度 变 得 很 大 ) 。 当 然 ， 如 果 关 键 字 只 是 一 个 


图 4-20 ”对 二 叉 查找 树 的 FindMax 
的 非 递 归 实 现 


更 大 结构 的 一 部 分 ， 那么 这 种 方法 行 不 通 ， 此 时 我 们 可 以 把 具有 相同 关键 字 的 所 有 结构 保 


留 在 一 个 辅助 数据 结构 中 ， 如 表 或 是 男 一 棵 查找 树 中 。 
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/ 
at 
ED, 


G 


图 4-21 


图 4-22 显示 插入 例 程 的 代码 。 由 于 工 指 向 该 树 的 根 ， 


© 
O 
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在 插入 5 以 前 和 以 后 的 二 叉 查找 树 


而 根 又 在 第 一 次 插入 时 变化 ， 因 








SearchTree 
Insert( ElementType X, SearchTree T ) 
y* TR ifC T == NULL ) 
{ 
/* Create and return a one-node tree */ 
/* 2h} T = malloc( sizeof( struct TreeNode ) ); 
/* 3*/ ifC T == NULL ) 
/* Ae] FatalError( "Out of space!!!" ); 
else 
{ 
/* 5*/ T->Element = X; 
/* 6*/ T-»Left = T-»Right = NULL; 
} 
} 
else 
/* 7*/ if( X < T->Element ) 
/* 8*/ T-»Left = Insert( X, T-»Left ); 
else 
/* 9*/ if( X > T->Element ) 
/*10*/ T->Right = Insert( X, T->Right ); 
/* Else X is in the tree already; we'll do nothing */ 
/*11*/ return T; /* Do not forget this line!! */ 
} 








图 4-22 ”插入 元 素 到 二 又 查找 树 的 


例 程 
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此 将 Insert 写成 一 个 返回 指向 新 树 根 的 指针 的 函数 。 第 8 行 和 第 10 行 递归 地 插入 X 到 适 
当 的 子 树 中 。 


4.3.5 Delete 
正如 许多 数据 结构 一 样 ， 最 困难 的 操作 是 删除 。 一 旦 发 现 要 删除 的 节点 ， 我 们 就 需要 
考虑 几 种 可 能 的 情况 。 


如 果 节 点 是 一 片 树叶 ， 那么 可 以 立即 删除 。 如 果 节 点 有 一 个 儿子 ， 则 该 节点 可 以 在 其 
父 节点 调整 指针 绕 过 该 节点 后 删除 (为 了 清楚 起 见 ， 我 们 将 明确 地 画 出 指针 的 指向 )， 见 
图 4-23。 注 意 ， 所 删除 的 节点 现在 已 不 再 引用 ， 而 该 节点 只 有 在 指向 它 的 指针 已 被 省 去 的 


情况 下 才能 删除 。 
@ 6) 
es 





' 图 4-23 具有 一 个 儿子 的 节点 (4) 删 除 前 后 的 情况 


复杂 的 情况 是 处 理 具有 两 个 儿子 的 节点 。 一 般 的 删除 策略 是 用 其 右 子 树 中 最 小 的 数据 
〈 很 容易 找到 ) 代 蔡 该 节点 的 数据 并 递归 地 删除 那个 节点 (现在 它 是 空 的 ) 。 因 为 右 子 树 中 最 
小 的 节点 不 可 能 有 左 儿 子 ， 所 以 第 二 次 Delete( 删 除 ) 更 容易 。 图 4-24 显示 一 棵 初始 的 树 
及 其 中 一 个 节点 被 删除 后 的 结果 。 要 删除 的 节点 是 根 的 左 儿子 ;其 关键 字 是 2。 它 被 右 子 树 
中 的 最 小 数据 (3) 所 代替 ， 然 后 关键 字 是 3 的 原 节 点 如 前 例 那 样 删除 。 


图 4-24 具有 两 个 儿子 的 节点 (2) 删 除 前 后 的 情况 
图 4-25 中 的 程序 完成 删除 的 工作 ， 但 它 的 效率 并 不 高 ， 因 为 它 沿 该 树 进 行 两 趟 搜索 以 


查找 和 删除 右 子 树 中 最 小 的 节点 。 写 一 个 特殊 的 DeleteMin 函数 可 以 容易 地 改变 效率 不 高 
的 缺点 ， 我 们 将 它 略 去 只 是 为 了 简明 紧凑 。 


84 数据 结构 与 算法 分 析 C 语言 描述 





SearchTree 
Delete( ElementType X, SearchTree T ) 
{ 


Position TmpCell; 


ifC T == NULL ) 
Error( "Element not found" ); 
else 
if( X < T->Element ) /* Go left */ 
T-»Left = Delete( X, T-»Left ); 
else 
if( X > T-5Element ) /* Go right */ 
T->Right = Delete( X, T->Left ); 
else /* Found element to be deleted */ 
if( T->Left && T->Right ) /* Two children */ 
{ 
/* Replace with smallest in right subtree */ 
TmpCell = FindMin( T->Right ); 
T->Element = TmpCell-»Element; 
T->Right = Delete( T->Element, T->Right ); 
} 
else /* One or zero children */ 


{ 


TmpCell = T; 

if( T-»Left == NULL ) /* Also handles 0 children */ 
T = T->Right; 

else if( T->Right == NULL ) 


T = T->Left; 
free( TmpCell ); 
} 


return T; 











4-25 ”二 叉 查找 树 的 删除 例 程 


如 果 删 除 的 次 数 不 多 ， 则 通常 使 用 的 策略 是 懒惰 删除 (lazy deletion): 当 一 个 元 素 要 被 
删除 时 ， 它 仍 留 在 树 中 ， 只 是 做 了 个 被 删除 的 记号 。 这 种 做 法 特别 是 在 有 重复 关键 字 时 很 
流行 ， 因 为 此 时 记录 出 现 频率 数 的 域 可 以 减 1。 如 果树 中 的 实际 节点 数 和 “被 删除 ”的 节点 
数 相同 ， 那 么 树 的 深度 预计 只 上 升 一 个 小 的 常数 。( 请 读者 思考 原因 。) 因 此 ， 存 在 一 个 与 懒 
惰 删 除 相关 的 非常 小 的 时 间 损 耗 。 再 有 ， 如 果 被 删除 的 关键 字 是 重新 插入 的 ， 那 么 分 配 一 
个 新 单元 的 开销 就 避免 了 。 


4. 3.6 平均 情形 分 析 


HWE, IR MakeEmpty 外 ， 我 们 期 望 前 一 节 所 有 的 操作 都 花费 O(log N) 时 间 ， 因 为 
我 们 用 常数 时 间 在 树 中 降低 了 一 层 ， 这 样 一 来 ， 对 树 的 操作 大 致 减少 一 半 左 右 。 因 此 ， 除 
MakeEmpty 外 ， 所 有 的 操作 都 是 OCaD y. Kp d 是 包含 所 访问 的 关键 字 的 节点 的 深度 。 

我 们 在 本 节 要 证 明 ， 假设 所 有 的 树 出 现 的 机 会 均等 ， 则 树 的 所 有 节点 的 平均 深度 
为 O(log ND, 

一 棵 树 的 所 有 节点 的 深度 的 和 称 为 内 部 路 径 长 (internal path length)。 我 们 现在 将 要 计算 
二 叉 查 找 树 平均 内 部 路 径 长 ， 其 中 平均 是 相对 于 二 又 查找 树 的 所 有 可 能 的 插入 序列 而 言 的 。 

令 D(N) 是 具有 个 节点 的 某 棵 树 T 的 内 部 路 径 长 ，D(1) 二 0。 一 棵 NN 节点 树 是 由 一 
Bi 节点 左 子 树 和 一 棵 (N 一 i 一 1) 节 点 右 子 树 以 及 深度 为 0 的 一 个 根 节点 组 成 ， 其 中 osi 
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N，D(i) 为 根 的 左 子 树 的 内 部 路 径 长 。 但 是 在 原 树 中 ， 所 有 这 些 节点 都 要 加 深 一 度 。 同 样 

的 结论 对 于 右 子 树 也 是 成 立 的 。 因 此 我 们 得 到 递归 关系 : 
D(N)=DG)+D(N—i—1)+N—1 

如 果 所 有 子 树 的 大 小 都 等 可 能 地 出 现 , 这 对 于 二 又 查找 树 是 成 立 的 (因为 子 树 的 大 小 只 依赖 

于 第 一 个 插入 到 树 中 的 元 素 的 相对 的 秩 ) ,但 对 于 二 又 树 则 不 成 立 , 那 么 DG) 和 DCN 一 ;一 1) 的 


平均 值 都 是 (1/N) SY DG) APE 





DCN) = 


在 第 7 章 将 遇 到 并 求解 这 个 递归 关系 ， 
得 到 的 平均 值 为 D(N)= 二 O(N log N). 
因此 任意 节点 的 期 望 深度 为 O(log ND. 
举 一 个 例子 ， 图 4-26 展示 了 随机 生成 
500 个 节点 的 树 的 节点 平均 深度 为 9. 98. 

但 是 ， 上 来 就 断言 这 个 结果 意味 着 
上 一 节 讨 论 的 所 有 操作 的 平均 运行 时 间 
是 O(log N) 并 不 完全 正确 。 原 因 在 于 删 
除 操作 ,我 们 并 不 清楚 是 否 所 有 的 二 叉 
查找 树 都 是 等 可 能 出 现 的 。 特 别 是 上 面 
描述 的 删除 算法 有 助 于 使 得 左 子 树 比 右 
子 树 深度 深 ， 因 为 我 们 总 是 用 右 子 树 的 
一 个 节点 来 代替 删除 的 节点 。 这 种 策略 
的 准确 效果 仍然 是 未 知 的 ， 但 它 似 乎 只 
是 理论 上 的 谜团 。 已 经 证 明 ， 如 果 我 们 
交替 插入 和 删除 @(CN ) 次 ,那么 树 的 期 
望 深度 将 是 BC(VN)。 在 25 万 次 随机 In- 
sert/Delete Jn, Al 4-26 中 右 沉 的 树 
看 起 来 明显 不 平衡 (平均 深度 二 12. 51)， 
见 图 4-27. 

在 删除 操作 中 ， 我 们 可 以 通过 随机 选 
取 右 子 树 的 最 小 元 素 或 左 子 树 的 最 大 元 素 图 4-27 Æ O(N’) Insert/Delete 后 的 二 叉 查 找 树 
来 代替 被 删除 的 元 素 以 消除 这 种 不 平衡 问题 。 这 种 做 法 明显 地 消除 了 上 述 偏向 并 使 树 保持 平 
f. 但 是 ,没有 人 实际 上 证 明 过 这 一 点 。 这 种 现象 似乎 主要 是 理论 上 的 问题 ， 因 为 对 于 小 的 
树 上 述 效果 根本 显示 不 出 来 ， 其 至 更 奇怪 ， 如 果 使 用 ol(N?) 对 Insert/Delete, 那么 树 似 乎 
可 以 得 到 平衡 ! 

上 面 的 讨论 主要 是 说 明 ， 明 确 “ 平 均 ” 意 味 着 什么 一 般 是 极其 困难 的 ， 可 能 需要 一 些 
假设 ， 这 些 假设 可 能 合理 ， 也 可 能 不 合理 。 不 过 ， 在 没有 删除 或 是 使 用 懒惰 删除 的 情况 下 ， 
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可 以 证 明 所 有 二 又 查 找 树 都 是 等 可 能 出 现 的 ， 而且 我 们 可 以 断言 上述 那 些 操 作 的 平均 运 
行 时 间 都 是 O(log N)。 除 像 上 面 讨论 的 一 些 个 别 情形 外 ， 这 个 结果 与 实际 观察 到 的 情形 是 
非常 吻合 

如 果 向 一 棵 树 输入 预先 排序 的 数据 ， 那 么 一 连 串 Insert 操作 将 花费 二 次 时 间 ， 而 用 
链表 实现 Insert 的 代价 会 非常 巨大 ， 因 为 此 时 的 树 将 只 由 那些 没有 左 儿 子 的 节点 组 成 。 
一 种 解决 办 法 就 是 要 有 一 个 称 为 平衡 (balance) 的 附加 的 结构 条 件 : 任何 节点 的 深度 均 不 得 
过 深 。 

有 许多 一 般 的 算法 可 以 实现 平衡 树 。 但 是 ， 大 部 分 算法 都 要 比 标准 的 二 叉 查 找 树 复杂 
得 多 ,而且 更 新 要 平均 花费 更 长 的 时 间 。 不 过 ,它们 确实 防止 了 处 理 起 来 非常 麻烦 的 一 些 
简单 情形 。 下 面 ， 我们 将 介绍 最 老 的 一 种 平衡 查找 树 ， 即 AVL ig 

另外 ， 较 新 的 方法 是 放弃 平衡 条 件 ， 允 许 树 有 任意 的 深度 ， 但 是 在 每 次 操作 之 后 要 使 
用 一 个 调整 规则 进行 调整 ， 使 得 后 面 的 操作 效率 更 高 。 pd NEU RR IN 
整 (self-adjusting) 类 结构 。 在 二 又 查找 树 的 情况 下 ， 对 于 任意 单个 运算 我 们 不 再 保证 O(log 
N) 的 时 间 界 ， 但 是 可 以 证 明 任意 连续 M 次 操作 在 最 坏 的 情形 下 花费 的 时 间 为 O(M log ND. 
一 般 这 足以 防止 令 人 环 手 的 最 坏 情 形 。 我 们 将 要 讨论 的 这 种 数据 结构 叫 作 伸 展 树 (splay 
tree)， 它 的 分 析 相 当 复 杂 ， 我 们 将 在 第 11 章 讨论 。 


4.4 AVL Bj 


AVL(Adelson-Velskii 和 Landis) 树 是 带 有 平衡 条 件 的 二 又 查 找 树 。 这 个 平衡 条 件 必须 
要 容易 保持 ， 而且 必须 保证 树 的 深度 是 O(log N)。 最 简单 的 想法 是 要 求 左 右 子 树 具 有 相同 
的 高 度 。 如 图 4-28 所 示 ， 这 种 想法 并 不 强求 树 的 深度 要 浅 。 

男 一 种 平衡 条 件 是 要 求 每 个 节点 都 必须 要 有 相同 高 

度 的 左 子 树 和 右 子 树 。 如 果 空 子 树 的 高 度 定义 为 一 1( 通 
常 就 是 这 么 定义 的 )， 那 么 只 有 具有 2 一 1 个 节点 的 理想 
平衡 树 (perfectly balanced tree) 满足 这 个 条 件 。 因 此， 4 
虽然 这 种 平衡 条 件 保证 了 树 的 深度 小 ， 但 是 它 太 严格 ， Pi 
难以 使 用 ， 需 要 放宽 条 件 。 

一 棵 AVL 树 是 其 每 个 节点 的 左 子 树 和 右 子 树 的 高 。 A Tn 
度 最 多 差 1 的 二 义 查 找 树 。( 空 树 的 高 度 定 义 为 一 1。) 在 
图 4-29 中 ， 左 边 的 树 是 AVL 树 ， 但 是 右边 的 树 不 是 。 每 一 个 节点 (在 其 节点 结构 中 ) 保 留 
高 度 信息 。 可 以 证 明 ， 大 致 上 讲 ， 一 个 AVL 树 的 高 度 最 多 为 1. 44 log(N+2)—1. 328, fH 
是 实际 上 的 高 度 只 比 log N 稍微 多 一 些 。 例 如 ， 图 4-30 显示 一 棵 具有 最 少 节点 (143) 高 度 为 
9 的 AVL 树 。 这 棵 树 的 左 子 树 是 高 度 为 7 上 且 节点 数 最 少 的 AVL 树 ， 右 子 树 是 高 度 为 8 的 
季 点 数 最 少 的 AVL 树 。 它 告诉 我 们 ， 在 高 度 为 h AY AVL 树 中 ， 最 少 节点 数 SCA) 由 SC) 二 
S(h 一 1) 十 SCh 一 2) 十 1 给 出 。 对 于 有 =0，S(h)=1; h=], S(h)=2., 函数 SCA) 53 SE WHR 
契 数 密切 相关 ， 由 此 推出 上 面 提 到 的 关于 AVL 树 的 高 度 的 界 。 
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图 4-29 两 棵 二 叉 查 找 树 ， 只 有 左边 的 树 是 AVL 树 


因此 ， 除 去 可 能 的 插入 外 (我 们 将 假设 懒惰 
删除 )， 所 有 的 树 操作 都 可 以 以 时 间 O(log NOD TAL D 
行 。 当 进行 插入 操作 时 ， 我 们 需要 更 新 通 向 根 S í A 
节点 路 径 上 那些 节点 的 所 有 平衡 信息 ， 而 插入 人 人 入 A A UA A 
操作 隐 合 着 困难 的 原因 在 于 ， 插 入 一 个 节点 可 AMA AMMM 
能 破坏 AVL 树 的 特性 。( 例 如 , 将 6 插入 到 LA AM ull | 
图 4-29 的 AVL 树 中 将 会 破坏 关键 字 为 8 的 节 | Lid Li LS UM 
点 的 平衡 条 件 。) 如 果 发 生 这 种 情况 ， 那 么 就 要 | | CAM 
把 性 质 恢 复 以 后 才 认 为 这 一 步 插入 完成 。 事 实 
上 ， 这 总 可 以 通过 对 树 进 行 简单 的 修正 来 做 图 4-30 BHAI 的 最 小 的 AVL 树 
到 ， 我 们 称 其 为 旋转 (rotation ) 。 

在 插入 以 后 ， 只 有 那些 从 插入 点 到 根 节点 的 路 径 上 的 节点 的 平衡 可 能 被 改变 ， 因 为 只 
有 这 些 节点 的 子 树 可 能 发 生变 化 。 当 我 们 沿 着 这 条 路 径 上 行 到 根 并 更 新 平衡 信息 时 ,我 们 
可 以 找到 一 个 节点 ， 它 的 新 平衡 破坏 了 AVL 条 件 。 我 们 将 指出 如 何在 第 一 个 这 样 的 节点 
( 即 最 深 的 节点 ) 重 新 平衡 这 棵 树 ， 并 证 明 ， 这 一 重新 平衡 保证 整 棵 树 满足 AVL 特性 。 

让 我 们 把 必须 重新 平衡 的 节点 叫 作 a。 由 于 任意 节点 最 多 有 两 个 儿子 ， 因 此 高 度 不 平 稀 
时 ,a 点 的 两 棵 子 树 的 高 度 差 2。 容 易 看 出 ， 这 种 不 平衡 可 能 出 现在 下 面 四 种 情况 中 : 

1. 对 a 的 左 儿 子 的 左 子 树 进行 一 次 插入 。 

2. 对 a 的 左 儿子 的 右 子 树 进行 一 次 插入 。 

3. Xt 的 右 儿 子 的 左 子 树 进行 一 次 插入。 

4. XF a 的 右 儿 子 的 右 子 树 进行 一 次 插入 。 

情形 1 和 4 是 关于 a 点 的 镜像 对 称 ， 而 情形 2 和 3 是 关于 a 点 的 镜像 对 称 。 因 此 ， 理 论 
上 只 有 两 种 情况 ， 当 然 从 编程 的 角度 来 看 还 是 四 种 情形 。 

第 一 种 情形 是 插入 发 生 在 “外 边 ”的 情形 ( 即 左 一 左 的 情形 或 右 一 右 的 情形 )， 该 情 
形 通 过 对 树 的 一 次 单 旋转 (single rotation) 而 完成 调整 。 第 二 种 情形 是 插入 发 生 在 “内 部 ” 
的 情形 ( 即 左 - 右 的 情形 或 右 - 左 的 情形 )， 该 情形 通过 稍微 复杂 些 的 双 旋 转 (double rota- 
tion) 来 处 理 。 我 们 将 会 看 到 ， 这 些 都 是 对 树 的 基本 操作 ， 它 们 多 次 用 于 平衡 树 的 一 些 算 
法 中 。 本 节 其 余部 分 将 描述 这 些 旋转 ， 证 明 它 们 足以 保持 树 的 平衡 ， 并 顺便 给 出 AVL Bt 
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的 一 种 非 正 式 实现 方法 。 第 12 章 描 述 其 他 的 平衡 树 方法 ， 这 些 方法 着 眼 于 AVL 树 的 更 
仔细 的 实现 。 


4.4.1 单 旋 转 


图 4-31 显示 单 旋转 如 何 调整 情形 1。 旋 转 前 的 图 在 左边 ， 而 旋转 后 的 图 在 右边 。 让 我 
们 来 分 析 有 具体 的 做 法 。 节 点 & 不 满足 AVL 平衡 特性 ， 因 为 它 的 左 子 树 比 右 子 树 深 2 层 ( 图 
中 间 的 儿 条 虚线 标示 树 的 各 层 )。 该 图 所 描述 的 情况 只 是 情形 1 的 一 种 可 能 情况 ,在 插入 之 
前 & 满足 AVL 特性 ,但 在 插入 之 后 这 种 特性 被 破坏 了 。 子 树 X 已 经 长 出 一 层 ， 这 使 得 它 
比 子 树 Z 深 出 2 层 。Y 不 可 能 与 新 X 在 同一 层 上 ， 因 为 那样 k 在 插入 以 前 就 已 经 失去 平衡 
Ts Y 也 不 可 能 与 Z 在 同一 层 上 ， 因 为 那样 k 就 会 是 在 通 向 根 的 路 径 上 破坏 AVL 平衡 条 
件 的 第 一 个 节点 。 


图 4-31 调整 情形 1 的 单 旋转 


为 使 树 恢复 平衡 ， 我 们 把 X 上 移 一 层 ， 并 把 Z 下 移 一 层 。 注 意 ， 此 时 实际 上 超出 了 
AVL 特性 的 要 求 。 为 此 ， 我 们 重新 安排 节点 以 形成 一 棵 等 价 的 树 ， 如 图 4-31 的 右 半 部 分 所 
示 。 抽 象 地 形容 就 是 : 把 树 形象 地 看 成 柔软 灵活 的 ， 抓 住 节点 名 ， 闭 上 你 的 双眼 ， 使 劲 摇 
动 它 ， 在 重力 作用 下 ，A 就 变 成 了 新 的 根 。 二 又 查找 树 的 性 质 告诉 我 们 ， 在 原 树 中 bh. 
于 是 在 新 树 中 k ÆT ki 的 右 儿 子 ，X RIZ 仍然 分 别 是 Ai 的 左 儿子 和 心 的 右 儿 子 。 子 树 
立 包含 原 树 中 介 于 A， Ak, 之 间 的 那些 节点 ， 可 以 将 它 放 在 新 树 中 es 的 左 儿子 的 位 置 上 ， 
这 样 ， 所 有 对 顺序 的 要 求 都 得 到 满足 。 

这 样 的 操作 只 需要 一 部 分 指针 改变 ， 结 果 我 们 得 到 另外 一 棵 二 又 查找 树 ， 它 是 一 棵 
AVL 树 ,因为 X 向 上 移动 了 一 层 , 了 停 在 原来 的 层 上 ,而 Z 下 移 一 层 。k。 和 不 仅 满 
E AVL 要 求 , 而 且 它们 的 子 树 都 恰好 处 在 同一 高 度 上 。 不 仅 如 此 ， 整 棵 树 的 新 高 度 恰恰 
与 插入 前 原 树 的 高 度 相 同 ， 而 插入 操作 却 使 得 子 树 X 长 高 了 。 因 此 ， 通 向 根 节 点 的 路 径 的 
高 度 不 需要 进一步 的 修正 ， 因 而 也 不 需要 进一步 的 旋转 。 图 4-32 显示 在 将 6 插入 左边 原始 
的 AVL 树 后 节点 8 便 不 再 平衡 。 于 是 , 我 们 在 7 和 8 之 间 做 一 次 单 旋转 ， 结 果 得 到 右 
边 的 树 。 

正如 我 们 较 早 提 到 的 ， 情 形 4 代表 一 种 对 称 的 情形 。 图 4-33 指出 单 旋转 如 何 使 用 。 让 
我 们 演示 一 个 稍微 长 一 些 的 例子 。 假 设 从 初始 的 空 AVL 树 开始 插入 关键 字 3、2 和 1， 然 
后 依 序 插 入 4 到 7。 在 插入 关键 字 1 时 第 一 个 问题 出 现 了 ，AVL 特性 在 根 处 被 破坏 。 我 们 
在 根 与 其 左 儿 子 之 间 施 行 单 旋转 修正 这 个 问题 。 下 面 是 旋转 之 前 和 之 后 的 两 棵 树 : 
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图 4-33 单 旋转 修复 情形 4 


图 中 虚线 连接 两 个 节点 ,它们 是 旋转 的 主体 。 下 面 我 们 插入 关键 字 为 4 的 节点 ， 这 没有 问 
i. 但 插入 5 破坏 了 在 节点 3 处 的 AVL 特性 ， 而 通过 单 旋转 又 将 其 修正 。 除 旋转 引起 的 局 部 
变化 外 ,编程 人 员 必 须 记 住 : 树 的 其 余部 分 必须 知晓 该 变化 。 如 本 例 中 节点 2 的 右 儿子 必须 
重新 设置 以 指向 4 来 代替 3。 这 一 点 很 容易 忘记 ， 从 而 导致 树 被 破坏 (4 就 会 是 不 可 访问 的 )。 


2) (2). 
o ^ QM -0 ^& 
旋转 之 前 (5) 旋转 之 后 人 
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下 面 我 们 插入 6。 这 在 根 节点 产生 一 个 平衡 问题 ， 因 为 它 的 左 子 树 高 度 是 0 而 右 子 树 高 度 为 
2。 因 此 我 们 在 根 处 在 2 和 4 之 间 实 施 一 次 单 旋转 。 


2) (4) 
A Ao 
ay A — & Q 
G U U © (e) 
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旋转 的 结果 使 得 2 是 4 的 一 个 儿子 而 4 原来 的 左 子 树 变 成 节点 2 的 新 的 右 子 树 。 在 该 子 树 
上 的 每 一 个 关键 字 均 在 2 和 4 之 间 ， 因 此 这 个 变换 是 成 立 的。 我们 插入 的 下 一 个 关键 字 是 
7， 它 导致 另外 的 旋转 : 





4.4.2 双 旋 转 


上 面 描述 的 算法 有 一 个 问题 : 如 图 4-34 所 示 ， 对 于 情形 2 和 3 上面 的 做 法 无 效 。 问题 
在 于 子 树 Y ATR. 单 旋转 没有 减低 它 的 深度 。 解 决 这 个 问题 的 双 旋 转 在 图 4-35 中 示 出 。 





E 4-35 ” 左 - 右 双 旋 转 修复 情形 2 


在 图 4-34 中 的 子 树 Y 已 经 有 一 项 插入 其 中 ， 这 个 事实 保证 它 是 非 空 的 。 因 此 ， 我 们 可 
以 假设 它 有 一 个 根 和 两 棵 子 树 。 于 是 ,我 们 可 以 把 整 棵 树 看 作 四 棵 子 树 由 3 个 节点 连接 。 
如 图 所 示 ， 恰 好 树 B 或 树 C 中 有 一 棵 比 D 深 两 层 (除非 它们 都 是 空 的 )， 但 是 我 们 不 能 肯定 


是 哪 一 棵 。 事 实 上 这 并 不 要 紧 ， 在 图 4-35 中 B 和 C 都 被 画 成 比 D 低 1 元 层 。 


为 了 重新 平衡 ， 我 们 看 到 ， 不 能 再 让 ks 作为 根 了 ， 而 图 4-34 所 示 的 在 ks Mk, 之 间 的 
旋转 又 解决 不 了 问题 ， 唯 一 的 选择 就 是 把 b. 用 作 新 的 根 。 这 人 迫使 & 是 ko 的 左 儿 子 ， 心 是 
它 的 右 儿 子 ， 从 而 完全 确定 了 这 四 棵 树 的 最 终 位 置 。 容 易 看 出 ， 最 后 得 到 的 树 满足 AVL 树 
的 特性 ， 与 单 旋转 的 情形 一 样 ， 我 们 也 把 树 的 高 度 恢复 到 插入 以 前 的 水 平 ， 这 就 保证 所 有 
的 重新 平衡 和 高 度 更 新 是 完善 的 。 图 4-36 指出 ， 对 称 情形 3 也 可 以 通过 双 旋 转 得 以 修正 。 
在 这 两 种 情形 下 ， 其 效果 与 先 在 a 的 儿子 和 孙子 之 间 旋 转 而 后 再 在 a 和 它 的 新 儿子 之 间 旋 
转 的 效果 是 相同 的 。 
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4-36 ” 右 - 左 双 旋 转 修 复 情形 3 
我 们 继续 在 前 面 例子 的 基础 上 以 倒序 插入 关键 字 10 到 16， 接 着 搬入 8， 然后 再 插入 9。 
插入 16 容易 ， 因 为 它 并 不 破坏 平衡 特性 ， 但 是 插入 15 就 会 引起 在 节点 7 处 的 高 度 不 平衡 。 
这 属于 情形 3， 需 要 通过 一 次 右 - 左 双 旋 转 来 解决 。 在 我 们 的 例子 中 ， 这 个 右 - 左 双 旋 转 将 涉 


及 7、16 和 15。 此 时 ，A 是 具有 关键 字 7 的 节点 ， 心 是 具有 关键 字 16 的 节点 ， 而 es 是 具 
有 关键 字 15 的 节点 。 子 树 A、B、C 和 DD 都 是 空 机 





下 面 我 们 搬入 14， 它 也 需要 一 次 双 旋 转 。 此 时 修复 该 树 的 双 旋 转 还 是 右 - 左 双 旋 转 ， 它 
将 涉及 6、15 和 7。 在 这 种 情况 下 ,，k, 是 具有 关键 字 6 的 节点 ,ks 是 具有 关键 字 7 的 节点 ， 
而 是 具有 关键 字 15 的 节点 。 子 树 A 的 根 在 关键 字 为 5 的 节点 上 ， 子 树 B 是 空子 树 ， 它 
是 关键 字 7 的 节点 原先 的 左 儿 子 ， 子 树 C 置 根 于 关键 字 14 的 节点 上 ， 最后， 子 树 D 的 根 在 
关键 字 为 16 的 节点 上 。 


o ® © qd 
ke! 
旋转 之 前 Y 


如 果 现 在 插入 13， 那 么 在 根 处 就 会 产生 不 平衡 。 由 于 13 不 在 4 和 7 之 间 ， 因此 我 们 知 
道 一 次 单 旋转 就 能 完成 修正 的 工作 。 
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[117| 12 的 插入 也 需要 一 次 单 旋转 : 


i 
Ae s 


旋转 之 前 





为 了 插入 11， 还 需要 进行 一 次 单 旋 转 ， 对 于 其 后 10 的 插入 也 需要 这 样 的 旋转 。 我 们 插 
A 8 不 进行 旋转 ,这 样 就 建立 了 一 棵 近乎 理想 的 平衡 树 。 





最 后 ， 我 们 插入 9 以 演示 双 旋 转 的 对 称 情形 。 注 意 ,， 插 入 9 使 得 含有 关键 字 10 的 节点 
产生 不 平衡 。 由 于 9 在 10 和 8 之 间 (8 是 通 向 9 的 路 径 上 的 节点 10 的 儿子 )， 因 此 需要 进行 
mme) 一 次 双 旋 转 ， 我 们 得 到 下 面 的 树 : 





7 


P 


APA 
8) (0) 


现在 让 我 们 对 上 面 的 讨论 作 个 总 结 。 除 几 种 情形 外 ， 编 程 的 细节 是 相当 简单 的 。 
为 将 关键 字 是 X 的 一 个 新 节点 插入 到 一 棵 AVL 树 工 中 ,我们 递归 地 将 X 插 入 到 工 的 
相应 的 子 树 ( 称 为 Te) 中 。 如 果 Te 的 高 度 不 变 ， 那么 插入 完 成 。 否 则 ， 如 果 在 工 中 出 


现 高 度 不 平衡 ， 那 么 我 们 根据 X 以 及 工 和 Tex 中 的 关键 字 做 适当 的 单 旋转 或 双 旋 转 ， 
更 新 这 些 高 度 ( 并 解决 好 与 树 的 其 余部 分 的 连接 )， 从 而 完成 插入 。 由 于 一 次 旋转 足以 
解决 问题 ， 因 此 仔细 地 编写 非 递 归 的 程序 一 般 说 来 要 比 编写 递归 程序 快 很 多 。 然 而 ， 
要 想 把 非 递归 程序 编写 正确 是 相当 困难 的 ， 因 此 许多 编程 人 员 还 是 用 递归 的 方法 实现 
AVL 树 。 

为 一 种 效率 问题 涉及 高 度 信息 的 存储 。 由 于 真正 需要 的 实际 上 就 是 子 树 高 度 的 差 ， 
应 该 保证 它 很 小 。 如 果 我 们 真 的 尝试 这 种 方法 ， 则 可 用 两 个 二 进 制 位 (代表 十 1、0、 一 1) 
表示 这 个 差 。 这 么 做 将 避免 平衡 因子 的 重复 计算 ， 但 是 却 丧 失 某 些 简明 性 。 最 后 的 程序 





多 多 少 少 要 比 在 每 一 个 节点 存储 高 度 时 复 
2e. üt BA EK. AB A XE ER A AN 
主要 考虑 的 问题 。 此 时 ， 通 过 存储 平衡 因子 
所 得 到 的 些微 的 速度 优势 很 难 抵 消 清晰 度 和 
相对 简明 性 的 损失 。 不 仅 如 此 ， 由 于 大 部 分 
机 器 存储 的 最 小 单位 是 8 个 二 进 制 位 ， 因 此 
所 用 的 空间 量 不 可 能 有 任何 差别 。8 位 使 我 
们 能 存储 高 达 255 的 绝对 高 度 。 既 然 树 是 平 
衡 的 ， 当 然 也 就 不 可 想象 这 会 不 够 用 ( 见 
练习 ) 。 

有 了 上 面 的 讨论 ， 
树 的 一 些 例 程 。 不 过 ， 我们 只 写 出 一 部 分 代 
码 ， ys He. 我 们 需要 些 声 
明 。 这 些 声明 在 图 4-37 中 给 出 。 age 

个 快速 的 函数 来 返回 节点 的 高 度 。 PR 
E EE 
图 4-38 中 给 出 。 
图 4-39). 


现在 准备 编写 AVL 





#ifndef _AviTree_H 


struct AvlNode; 
typedef struct AvlNode *Position; 
typedef struct AvlNode *AvlTree; 


AvlTree MakeEmpty( AvlTree T ); 

Position Find( ElementType X, AvlTree T ); 
Position FindMin( AvlTree T ); 

Position FindMax( AvlTree T ); 

AvlTree Insert( ElementType X, AvlTree T ); 
AviTree Delete( ElementType X, AvlTree T ); 
ElementType Retrieve( Position P ); 


#endif /* _AvlTree_H */ 


/* Place in the implementation file */ 
struct AvlNode 


ElementType Element; 
AvlTree Left; 
AvlTree Right; 

int Height; 








图 4-37 AVL 树 的 节点 声明 


基本 的 插入 例 程 写 起 来 很 容易 ， 因 为 它 主要 由 一 些 函 数 调用 组 成 ( 见 


对 于 图 4-40 中 的 那些 树 ，singleRotateWithLeft 把 左边 的 树 变 成 右边 的 树 ， 并 返 


回 指向 新 根 的 指针 。 
m. 
我 们 要 写 的 最 后 


SingleRotateWithRight 做 的 工作 恰好 相反 。 程 序 在 图 4-41 中 


一 个 函数 完成 图 4-42 所 描述 的 双 旋 转 ， 其 程序 由 图 4-43 示 出 。 





static int 


else 





Height( Position P ) 
{ 


ifC P = NULL ) 
return -1; 


return P->Height; 








图 4-38 


计算 AVL 节点 的 高 度 的 函数 
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AvlTree 
Insert( ElementType X, AvlTree T ) 


{ 
ifC T == NULL ) 


{ 
/* Create and return a one-node tree */ 
T = malloc( sizeof( struct AvlNode ) ); 
ifC T == NULL ) 
FatalError( "Out of space!!!" ); 
else 
1 
T->Element = X; T->Height = 0; 
T->Left = T->Right = NULL; 
} 
} 
else 


ifC X < T->Element ) 
{ 
T->Left = Insert( X, T->Left ); 
ifC Height( T->Left ) - Height( T->Right ) == 2 ) 
ifC X « T->Left->Element ) 
T = SingleRotateWithLeft( T ); 
else 
T 


DoubleRotateWithLeft( T ); 
} 
else 
if( X > T->Element ) 
{ 
T->Right = Insert( X, T->Right ); 
ifC Height( T->Right ) - Height( T->Left ) == 2 ) 
ifC X > T->Right->Element ) 
T = SingleRotateWithRight( T ); 
else 


T = DoubleRotateWithRight( T ); 


/* Else X is in the tree already; we'll do nothing */ 


T-»Height = Max( Height( T->Left ), Height( T->Right ) ) + 1; 
return T; 





4-39 向 AVL 树 插入 节点 的 函数 


图 4-40 单 旋 转 








/* This function can be called only if K2 has a left child */ 
/* Perform a rotate between a node (K2) and its left child */ 
/* Update heights, then return new root */ 


static Position 
SingleRotateWithLeft( Position K2 ) 
{ 


Position K1; 


K1 = K2->Left; 
K2->Left = K1->Right; 
K1->Right = K2; 


K2->Height = Max( Height( K2->Left ), 
Height( K2->Right ) ) 
) 


+ 1; 
K1-»Height = Max( Height( Kl-»Left ), K2->Height ) + 1; 


return K1; /* New root */ 











4-41 执行 单 旋转 的 例 程 
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图 4-42” 双 旋转 





/* This function can be called only if K3 has a left */ 
/* child and K3's left child has a right child */ 

/* Do the left-right double rotation */ 

/* Update heights, then return new root */ 


static Position 
DoubleRotateWithLeft( Position K3 ) 
{ 
/* Rotate between K1 and K2 */ 
K3->Left = SingleRotateWithRight( K3->Left ); 


/* Rotate between K3 and K2 */ 
return SingleRotateWithLeft( K3 ); 











4-43 ”执行 双 旋 转 的 例 程 


对 AVL 树 的 删除 多 少 要 比 插入 复杂 。 如 果 删 除 操 作 相 对 较 少 ， 那 么 懒 居 删 除 铠 怕 是 最 
好 的 策略 。 


4.5 伸展 树 


现在 我 们 描述 一 种 相对 简单 的 数据 结构 ， 叫 作 伸 展 树 (splay tree)， 它 保证 从 空 树 开始 
任意 连续 M 次 对 树 的 操作 最 多 花费 OCM log N) 时 间 。 虽 然 这 种 保证 并 不 排除 任意 一 次 操 
作 花 费 O(N) 时 间 的 可 能 ， 而 且 这 样 的 界 也 不 如 每 次 操作 最 坏 情形 的 界 O(log N) 那 么 短 ， 
但 是 实际 效果 是 一 样 的 一 一 不 存在 坏 的 输入 序列 。 一 般 说 来 ， 当 M 次 操作 的 序列 总 的 最 坏 
情形 运行 时 间 为 OCMF(N)) 时 ， 我们 就 说 它 的 挫 还 (amortized) 运 行 时 间 为 OCFCNDO , DNI 
此 ,一 棵 伸展 树 每 次 操作 的 挫 还 代价 是 O(log N)。 经 过 一 系列 的 操作 之 后 ， 有 的 可 能 花费 
时 间 多 一 些 ， 有 的 可 能 要 少 一 些 。 

伸展 树 是 基于 这 样 的 事实 : 对 于 二 又 查找 树 来 说 ， 每 次 操作 最 坏 情 形 时 间 O(N) 并 不 
坏 ， 只 要 它 相 对 不 常 发 生 就 行 。 任 何 一 次 访问 即使 花费 OCN) ， 仍 然 可 能 非常 快 。 二 又 查找 
树 的 问题 在 于 ， 虽 然 一 系列 访问 整体 都 有 可 能 发 生 不 良 操 作 ， 但 是 很 罕见 。 此 时 ， 累 积 的 
运行 时 间 很 重要 。 具 有 最 坏 情 形 运行 时 间 O(N) 但 保证 对 任意 M 次 连续 操作 最 多 花费 
OCM log N) 运 行 时 间 的 查找 树 数据 结构 确实 令 人 满意 ， 因 为 不 存在 坏 的 操作 序列 。 

如 果 任 意 特定 操作 可 以 有 最 坏 时 间 界 O(N)， 而 我 们 仍然 要 求 一 个 O(log N) 的 摊 还 时 
间 界 ,那么 很 清楚 ， 只 要 一 个 节点 被 访问 ， 它 就 必须 被 移动 。 否 则 ， 一旦 我 们 发 现 一 个 深 
层 的 节点 ， 我们 就 有 可 能 不 断 对 它 进行 Fina 操作 。 如 果 这 个 节点 不 改变 位 置 ， 而 每 次 访 
问 又 花费 O(N)， 那么 M 次 访问 将 花费 OCM. NN) 的 时 间 。 
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伸展 树 的 基本 想法 是 ， 当 一 个 节点 被 访问 后 ， 它 就 要 经 过 一 系列 AVL 树 的 旋转 后 放 到 
根 上 。 注 意 ， 如 果 一 个 节点 很 深 ， 那 么 在 其 路 径 上 就 存在 许多 的 节点 也 相对 较 深 ， 通 过 重 
新 构造 可 以 使 对 所 有 这 些 节点 的 进一步 访问 所 花费 的 时 间 变 少 。 因 此 ， 如 果 节 点 过 深 ， 那 
RD TR ee ee 除 在 理论 上 给 出 好 的 时 间 
界外 ， 这 种 方法 还 可 能 有 实际 的 效用 ， 因 为 在 许多 应 用 中 当 一 个 节点 被 访问 时 ， 它 就 很 可 
能 不 久 再 被 访问 到 。 研 究 表明 ，3 vor mi 另外 ， 伸 展 树 
还 不 要 求 保 留 高 度 或 平衡 信息 ， 因 此 它 在 某 种 程度 上 节省 空间 并 简化 代码 (特别 是 当 实 现 例 
程 经 过 审慎 考虑 而 被 写 出 的 时 候 ) 。 


4. 5. 1 一 个 简单 的 想法 


实施 上 面 描述 的 重新 构造 的 一 种 方法 是 执行 单 旋转 ， 从 下 向 上 进行 。 这 意味 着 我 们 将 
在 访问 路 径 上 的 每 一 个 节点 和 它们 的 父 节 点 间 实 施 旋转 。 作 为 例子 ， 考虑 在 下 面 的 树 中 对 
ki 进行 一 次 访问 (一 次 Find) 之 后 所 发 生 的 情况 。 


ks 
ee Ssh 
EDN AN 


M d e ZEN 
eee Z EN, 
2 un 分 s 


虚线 是 访问 的 路 径 。 首 先 ， 我们 在 & 和 它 的 父 节 点 之 间 实施 一 次 单 旋转 ， 得 到 下 面 
的 树 











然后 ， 我 们 在 & Mlk; 之 间 旋 转 ， 得 到 下 一 棵 树 。 


E os ay me 
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uU ee 
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再 实行 两 次 旋转 直到 A 到 达 树 根 。 
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这 些 旋转 的 效果 是 将 & 一 直 推 向 树 根 ， 使 得 对 A 的 进一步 访问 很 容易 (暂时 的 )。 不 足 
的 是 它 把 另外 一 个 节点 (As ) 几 乎 推 向 和 包 以 前 同样 的 深度 。 而 对 那个 节点 的 访问 又 将 把 另 
外 的 节点 向 深 处 推进 ， 如 此 等 等 。 虽 然 这 个 策略 使 得 对 A 的 访问 花费 时 间 减 少 ， 但 是 它 并 
没有 明显 地 改变 (原先 ) 访 问 路 径 上 其 他 节点 的 状况 。 事 实 上 可 以 证 明 ， 对 于 这 种 策略 将 会 
存在 一 系列 M 个 操作 共 需 要 QC(M。N) 的 时 间 ， 因 此 这 个 想法 还 不 够 好 。 证 明 这 件 事 最 简 
单 的 方法 是 考虑 向 初始 的 空 树 插入 关键 字 1，2，3，…，N 所 形成 的 树 ( 请 将 这 个 例子 算 
出 )。 由 此 得 到 一 棵 树 ， 这 棵 树 只 由 一 些 左 儿子 构成 。 由 于 建立 这 棵 树 总 共 花 费 的 时 间 为 
O(N)， 因 此 这 未 必 就 有 多 坏 。 问 题 在 于 访问 关键 字 为 1 的 节点 花费 N 一 1 个 时 间 单 元 。 在 
这 些 旋转 完成 以 后 ， 对 关键 字 为 2 的 节点 的 一 次 访问 花费 N —2 个 时 间 单 元 。 依 序 访问 所 有 


关键 字 的 总 时 间 是 >) i 一 AN’) ,在 它们 都 被 访问 以 后 ,该 树 转 变 回 原始 状态 , 且 我 们 可 能 重 
复 这 个 访问 顺序 。 


4.5.2 展开 


展开 (splaying) 的 思路 类 似 于 前 面 介绍 的 旋转 的 想法 ， 不 过 在 旋转 如 何 实施 上 我 们 稍微 
有 些 选 择 的 余地 。 我 们 仍然 从 底部 向 上 沿 着 访问 路 径 旋 转 。 令 X 是 在 访问 路 径 上 的 一 个 ( 非 
根 ) 节 点 ， 我 们 将 在 这 个 路 径 上 实施 旋转 操作 。 如 果 X 的 父 节点 是 树 根 ， 那 么 我 们 只 要 旋转 
X 和 树 根 。 这 就 是 沿 着 访问 路 径 上 的 最 后 的 旋转 。 和 否则 ，X 就 有 父亲 (P) 和 祖父 (G)， 存 在 
两 种 情形 以 及 对 称 的 情形 要 考虑 。 第 一 种 情形 是 之 字形 (zig-zag) 情 形 ( 见 图 4-44)。 这 里 ，X 
是 右 儿 子 ， 书 是 左 儿 子 ( 反 之 亦 然 )。 如 果 是 这 种 情形 ， 那 么 我 们 就 执行 一 次 像 AVL 那样 的 
双 旋 转 。 否 则 ， 出 现 男 一 种 一 字形 (zig-zig) 情 形 : X 和 PP 或 者 都 是 左 儿 子 , 或 者 都 是 右 儿 
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子 。 在 这 种 情形 下 ， 我 们 把 图 4-45 左边 的 树 变 换 成 右边 的 树 。 











/AN, BN 


图 4-45 一 字形 情形 


[126 | 举 个 例子 ， 考 虑 来 自 最 后 的 例子 中 的 树 ， 对 A 执行 一 次 Find: 








双 旋 转 。 得 到 如 下 的 树 。 











虽然 从 一 些小 例子 很 难看 出 来 ， 但 是 展开 操作 不 仅 将 访问 的 节点 移动 到 根 处， 而 且 还 有 把 
访问 路 径 上 的 大 部 分 节点 的 深度 大 致 减少 一 半 的 效果 ( 某 些 浅 的 节点 最 多 向 下 推 后 两 个 层次 )。 

再 来 考虑 将 关键 字 为 1，2，3，…， 的 节点 搬入 到 初始 空 树 中 的 效果 。 如 前 所 述 可 知 共 花 
费 OUN) 时 间 并 产生 与 一 些 简单 旋转 结果 相同 的 树 。 图 4-46 指出 在 关键 字 为 1 的 节点 展开 的 结 
果 。 区 别 在 于 ， 在 对 关键 字 为 1 的 节点 访问 (花费 N— 1 个 时 间 单 元 ) 之 后 ， 对 关键 字 为 2 的 节点 
的 访问 只 花费 N/2 个 时 间 单 元 而 不 是 N 一 2 个 时 间 单 元 ; 不 存在 像 以 前 那么 深 的 节点 。 
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图 4-46 在 节点 1 展开 的 结果 


对 关键 字 为 2 的 节点 的 访问 将 把 这 些 节 点 带 到 距 根 N/4 的 深度 范围 之 内 ， 并 且 如 此 进行 
下 去 直到 深度 大 约 为 log NN=7 的 例子 太 小 ， 不 能 很 好 地 看 清 这 种 效果 )。 图 4-47 到 图 4-55 
显示 在 32 个 节点 的 树 中 访问 关键 字 1 到 9 的 结果 ， 这 棵 树 最 初 只 含有 左 儿 子 。 使 用 伸展 树 不 
会 出 现在 简单 旋转 策略 中 常见 的 那 种 低 效 率 的 坏 现象 。( 实 际 上 ， 这 个 例子 只 是 一 种 非常 好 的 
情况 。 有 一 个 相当 复杂 的 证 明 指 出 ， 对 于 这 个 例子 ，N 次 访问 共 耗 费 OCN) 的 时 间 。) 
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图 4-47. ”将 全 部 由 左 儿 子 构成 的 树 在 节点 1 处 展开 的 结果 
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图 4-51 将 前 面 的 树 在 节点 5 处 展开 
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4-53 ”将 前 面 的 树 在 节点 7 处 展开 











图 4-55 ”将 前 面 的 树 在 节点 9 处 展开 
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这 些 图 着 重 强 调 了 伸展 树 基 本 的 和 关键 的 特性 。 当 访问 路 径 太 长 而 导致 超出 正常 查找 
时 间 的 时 候 ， 这 些 旋转 将 对 未 来 的 操作 有 益 。 当 访问 耗 时 很 少 的 时 候 ， 这 些 旋转 则 不 那么 
有 益 甚 至 有 害 。 极 端的 情形 是 经 过 若干 插入 而 形成 的 初始 树 。 所 有 的 插入 都 是 花费 常数 时 
间 的 操作 ， 会 导致 坏 的 初始 树 。 此 时 ， 我 们 会 得 到 一 棵 很 差 的 树 ， 但 是 运行 却 比 预计 的 快 ， 
从 而 总 的 较 少 运行 时 间 补 偿 了 损失 。 这 样 ， 少数 真正 麻烦 的 访问 却 留 给 我 们 一 棵 几乎 平衡 
的 树 ， 其 代价 是 我 们 必须 返还 某 些 已 经 省 下 的 时 间 。 我 们 将 在 第 11 童 证 明 的 主要 定理 指 
出 ， 每 个 操作 绝 不 会 落后 O(log N) 这 个 时 间 一 一 我 们 总 是 遵守 这 个 时 间 ， 即 使 偶尔 有 些 不 
良 操作 。 

我 们 可 以 通过 访问 要 删除 的 节点 实行 删除 操作 。 这 种 操作 将 节点 上 推 到 根 处 。 如 果 删 
除 该 节点 ， 则 得 到 两 棵 子 树 T, 和 TR( 左 子 树 和 右 子 树 )。 如 果 我 们 找到 T, 中 最 大 的 元 素 
(这 很 容易 )， 那 么 就 将 这 个 元 素 旋转 到 T, 的 根 下 ， 而 此 时 T, 将 有 一 个 没有 右 儿 子 的 根 。 
我 们 可 以 使 Tr 成 为 右 儿 子 从 而 结束 删除 。 

对 伸展 树 的 分 析 很 困难 ， 因 为 树 的 结构 经 常 变化 。 另 一 方面 ,伸展 树 的 编程 要 比 
AVL 树 简单 得 多 , 这 是 因为 要 考虑 的 情形 少 并 且 没 有 平衡 信息 需要 存储 。 实 际 经 验 指 
出 ， 在 实践 中 它 可 以 转化 成 更 快 的 程序 代码 ， 不 过 这 种 状况 还 远 非 完美 。 最 后 ， 我 们 指 
出 ,伸展 树 有 几 种 变化 ,它们 在 实践 中 甚至 运行 得 更 好 。 有 一 种 变化 将 在 第 12 章 中 完全 
编程 实现 。 


4.6 树 的 遍历 





由 于 二 又 查找 树 中 对 信息 进行 了 排序 ， 因 而 按 顺序 列 出 所 有 的 关键 字 会 很 简单 ， 递 归 
过 程 如 图 4-56 所 示 。 | 

毫 无 疑问 ， 该 过 程 能 够 解决 将 关键 字 排 序列 出 | Wiftrreec searchtree T) 
的 问题 。 正 如 我 们 前 面 看 到 的 ， 这 类 例 程 当 用 到 树 | ^o irer ie wu) 


上 的 时 候 则 称 为 中 Æ im ht 由 TE 依 序 列 出 Allg 关键 PrintTree( T->Left ); 
字 ， 因 此 是 有 意义 的 )。 中 序 遍历 的 一 般 策 略 是 首先 "uM E 


遍历 左 子 树 ， 然 后 是 当前 的 节点 ， 最 后 遍历 右 子 树 。 | ; 
这 个 算法 的 有 趣 部 分 除 它 简单 的 特性 外 ， 还 在 于 其 
总 的 运行 时 间 是 O(N)。 这 是 因为 在 树 的 每 一 个 节点 E456 按 顺序 打印 二 又 查找 树 的 例 程 
处 进行 的 工作 都 是 常数 时 间 的 。 每 一 个 节点 访问 一 次 ， 而 在 每 一 个 节点 进行 的 工作 是 检测 
是 否 为 NULL、 建 立 两 个 过 程 调用 并 执行 brintElement。 由 于 在 每 个 节点 的 工作 花费 常数 
时 间 以 及 总 共有 N 个 节点 ， 因 此 运行 时 间 为 O(N)。 

有 时 我 们 需要 先 处 理 两 棵 子 树 然后 才能 处 理 当前 节点 。 例 如 ， 为 了 计算 一 个 节点 的 高 
度 ， 我 们 需要 知道 它 的 两 棵 子 树 的 高 度 。 图 4-57 中 的 程序 就 是 计算 高 度 的 。 由 于 检查 一 些 
特殊 的 情况 总 是 有 益 的 ( 当 涉 及 递归 时 尤其 重要 )， 因 此 要 注意 这 个 例 程 声 明 树叶 的 高 度 为 
零 ， 这 是 正确 的 。 这 种 一 般 的 遍历 顺序 叫 作 后 序 遍历 ,我们 在 前 面 也 见 到 过 。 因 为 在 每 个 
节点 的 工作 花费 常数 时 间 ， 所 以 总 的 运行 时 间 也 是 ON). 














int 
Height( Tree T ) 
{ 


TEC T == NULL J 
return -1; 
else 
return 1 + Max( Height( T->Left ), 
Height( T->Right ) ); 





} 








4-57 ”使 用 后 序 遍 历 计 算 树 的 高 度 的 例 程 


我 们 见 过 的 第 三 种 常用 的 遍历 方案 为 先 序 遍 历 (preorder traversal)。 这 里 ， 当 前 节点 在 
其 儿子 节点 之 前 处 理 。 这 种 遍历 可 以 利用 节点 深度 标志 每 一 个 节点 。 

所 有 这 些 例 程 有 一 个 共有 的 想法 ， 那 就 是 首先 处 理 NULL 的 情形 ， 然 后 才 是 其 余 的 工 
作 。 注 意 ， 此 处 缺少 一 些 额外 的 变量 。 这 些 例 程 仅仅 传递 了 树 ， 并 没有 声明 或 是 传递 任何 
额外 的 变量 。 程 序 越 紧 次， 一 些 思春 的 错误 出 现 的 可 能 就 越 小 。 第 四 种 遍历 用 得 很 少 ， 叫 
作 层 序 遍 历 (level-order traversal), 我 们 以 前 尚未 见 到 过 。 在 层 序 遍历 中 ， 所 有 深度 为 D 
的 节点 要 在 深度 了 十 1 的 节点 之 前 处 理 。 层 序 遍 历 与 其 他 类 型 的 遍历 不 同 的 地 方 在 于 它 不 是 
递归 实施 的 ; 它 用 到 队列 ， 而 不 使 用 递归 所 默 示 的 栈 。 


4.7 BH 


虽然 迄今 为 止 我 们 所 看 到 的 查找 树 都 是 二 叉 树 ， 但 是 还 有 一 种 常用 的 查找 树 不 是 二 又 
树 。 这 种 树 叫 作 B 树 (B-tree)。 

阶 为 M 的 也 树 是 一 棵 具有 下 列 结构 特性 的 树 : 

e 树 的 根 或 者 是 一 片 树 叶 ， 或 者 其 儿子 数 在 2 和 M 之 间 。 

e 除根 外 ， 所 有 非 树 叶 节 点 的 儿子 数 在 [M/2 1 和 M 之 间 。 

e 所 有 的 树叶 都 在 相同 的 深度 上 。 

所 有 的 数据 都 存储 在 树叶 上 。 在 每 一 个 内 部 节点 上 皆 含 有 指向 该 节点 各 儿子 的 指针 
Pis Pos very Pu USD TAR BEF Pos Pas 0o Pu 中 发 现 的 最 小 关键 字 的 值 Ai， 
ks，…，ku-1。 当 然 ， 可 能 有 些 指 针 是 NULL. ghi HOM LAW k 则 是 未 定义 的 。 对 于 每 一 个 节 
点 ， 其 子 树 P 中 所 有 的 关键 字 都 小 于 子 树 Po 的 关键 字 ， 等 等 。 树 叶 包 含 所 有 实际 数据 ， 
这 些 数据 或 者 是 关键 字 本 身 ， 或 者 是 指向 含有 这 些 关 键 字 的 记录 的 指针 。 为 使 例子 简单 ， 
我 们 将 假设 为 前 者 。B 树 有 多 种 定义 ,这 些 定 义 在 一 些 次 要 的 细节 上 不 同 于 我 们 定义 的 结 
构 ， 不 过 ,我们 定义 的 B 树 是 一 种 流行 的 结构 。( 另 一 种 流行 的 结构 允许 实际 数据 存储 在 树 
叶 上 ， 也 可 以 存储 在 内 部 节点 上 ， 正 如 我 们 在 二 叉 查找 树 中 所 做 的 那样 ,) 我 们 还 要 求 ( 暂 
时 ) 在 ( 非 根 ) 树 叶 中 关键 字 的 个 数 也 在 TM/2 1 和 M 之 间 。 

图 4-58 中 的 树 是 4 阶 B 树 的 一 个 例子 。 

4 阶 B 树 更 流行 的 称呼 是 2-3-4 BY. 1 3 阶 B 树 叫 作 2-3 树 。 我 们 将 通过 2-3 树 的 特殊 
情形 来 描述 B 树 的 操作 。 现 在 从 下 面 的 2-3 树 开始 。 
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图 4-58 4 阶 B 树 à 














我 们 用 椭圆 画 出 内 部 节点 ( 非 树叶 )， 每 个 节点 含有 两 个 数据 。 椭 圆 中 的 短 横 线 表示 内 
部 节点 的 第 二 个 信息 ， 它 表明 该 节点 只 有 两 个 儿子 。 树 叶 用 方 框 画 出 ， 框 内 含有 关键 字 。 
树叶 中 的 关键 字 是 有 序 的 。 为 了 执行 一 次 Find， 我 们 从 根 开 始 并 根据 要 查找 的 关键 字 与 存 
储 在 节点 上 的 两 个 (很 可 能 是 一 个 ) 值 之 间 的 关系 确定 (最 多 ) 三 个 方向 中 的 一 个 方向 。 
为 了 对 尚未 见 过 的 关键 字 X 执行 一 次 Insert， 我 们 首先 按照 执行 Find 的 步骤 进行 。 
当 到 达 一 片 树叶 时 ， 我 们 就 找到 了 插入 X 的 正确 的 位 置 。 例 如 ， 为 了 插 和 人 关键 字 为 18 的 节 
134| 点 ， 我 们 可 以 就 把 它 加 到 一 片 树 叶 上 而 不 破坏 2-3 树 的 性 质 。 插 入 结果 表示 在 下 列 图 中 。 
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不 过 ， 由 于 一 片 树叶 只 能 容纳 两 个 或 三 个 关键 字 ， 因 此 上 面 的 做 法 不 总 是 可 行 的 。 如 
果 我 们 现在 试图 把 1 插入 到 树 中 ,那么 就 会 发 现 1 所 属于 的 节点 已 经 满 了 。 将 这 个 新 的 关 
键 字 放 和 该 节点 使 得 它 有 了 四 个 关键 字 ， 这 是 不 允许 的 。 解 决 的 办 法 是 ， 构 造 两 个 节点 ， 
每 个 节点 有 两 个 关键 字 ， 同 时 调整 它们 父 节 点 的 信息 ， 如 下 图 所 示 。 
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然而 ， 这 个 想法 也 不 总 能 行 得 通 ， 当 尝试 将 19 插入 到 当前 的 树 中 时 就 会 看 出 问题 。 如 
果 构 造 两 个 节点 ， 每 个 节点 有 两 个 关键 字 ， 那 么 我 们 得 到 下 列 的 树 。 
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这 棵 树 的 一 个 内 部 节点 有 了 四 个 儿子 ， 可 是 我 们 只 允许 每 个 节点 有 三 个 儿子 。 解 决 方 
法 很 简单 。 我 们 只 要 将 这 个 节点 分 成 两 个 节点 ， 每 个 节点 两 个 儿子 即 可 。 当 然 ， 这 个 节点 
本 身 可 能 就 是 三 个 儿子 节点 之 一 ， 而 这 样 分 裂 该 节点 将 给 它 的 父 节点 带 来 一 个 新 问题 (该 父 
节点 就 会 有 四 个 儿子 )， 但 是 我 们 可 以 在 通 向 根 的 路 径 上 一 直 这 人 么 分 下 去 ， 直 到 或 者 到 达 根 
节点 ， 或 者 找到 一 个 只 有 两 个 儿子 的 节点 。 在 我 们 的 例子 中 ， 通 过 分 裂 节点 的 方法 我 们 只 
能 到 达 所 见 到 的 第 一 个 内 部 节点 ， 得 到 如 下 的 树 。 
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如 果 现 在 插入 关键 字 为 28 的 一 个 元 素 ， 那 么 就 会 出 现 一 片 具有 四 个 儿子 的 树叶 ， 它 可 
以 分 成 两 片 树叶 ， 每 叶 两 个 儿子 : 
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这 样 ， 又 产生 一 个 具有 四 个 儿子 的 内 部 节点 ， 此 时 将 它 分 成 两 个 儿子 节点 。 我 们 这 里 


做 的 就 是 把 根 节点 分 成 两 个 节点 。 这 个 时 候 ， 我们 得 到 一 个 特殊 情况 ， 通 过 创建 一 个 新 的 
根 节点 我 们 可 以 结束 对 28 的 插入 。 这 是 2-3 树 增 加 高 度 的 (唯一 ) 方 法 。 
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还 要 注意 ， 当 搬入 一 个 关键 字 的 时 候 ， 只 有 在 访问 路 径 上 的 那些 内 部 节点 才 有 可 能 发 
生变 化 。 这 些 变 化 与 这 条 路 径 的 长 度 成 比例 ; 但 是 要 注意 ， 由 于 需要 处 理 的 情况 相当 多 ， 
因此 很 容易 发 生 错误 。 

对 于 一 个 节点 的 儿子 太 多 的 情况 还 有 一 些 其 他 处 理 方法 ， 而 我 们 刚才 描述 的 方法 您 怕 
是 最 简单 的 情况 。 当 试图 将 第 四 个 关键 字 添加 到 一 片 树叶 上 的 时 候 ， 我 们 可 以 首先 查找 只 
有 两 个 关键 字 的 兄弟 ， 而 不 是 把 这 个 节点 分 裂 成 两 个 。 例 如 ， 为 把 70 添加 到 上 面 的 树 中 ， 
我 们 可 以 把 58 挪 到 含有 和 和 52 的 树叶 中 ， 再 把 70 与 59 和 61 放 到 一 起 ， 并 调整 一 些 内 部 
节点 中 的 各 项 。 这 个 策略 也 可 以 用 到 内 部 节点 上 并 尽量 使 更 多 的 节点 具有 足够 的 关键 字 。 
这 种 方法 使 得 例 程 的 编制 稍微 有 些 复 杂 ， 但 是 浪费 的 空间 较 少 。 

我 们 可 以 通过 查找 要 删除 的 关键 字 并 将 其 除去 而 完成 删除 操作 。 如 果 这 个 关键 字 是 一 个 
节点 仅 有 的 两 个 关键 字 中 的 一 个 ， 那 么 将 它 除 去 后 就 只 剩 一 个 关键 字 了 。 此 时 我 们 可 以 通过 
把 这 个 节点 与 它 的 一 个 兄弟 合并 来 进行 调整 。 如 果 这 个 兄弟 已 有 3 个 关键 字 ， 那么 我 们 可 以 
从 中 取出 一 个 使 得 两 个 节点 各 有 两 个 关键 字 。 如 果 这 个 兄弟 只 有 两 个 关键 字 ， 那 么 我 们 就 将 
这 两 个 节点 合并 成 一 个 具有 3 个 关键 字 的 节点 。 现 在 这 个 节点 的 父亲 则 失去 一 个 儿子 ， 因 此 
我 们 还 须 向 上 检查 直到 顶部 。 如 果 根 节点 失去 了 它 的 第 二 个 儿子 ， 那 么 这 个 根 也 要 删除 ， 而 
树 则 减少 了 一 层 。 当 合并 节点 的 时 候 ， 我 们 必须 记 住 要 更 新 保存 在 这 些 内 部 节点 上 的 信息 。 

对 于 一 般 的 M 阶 了 B 树 ， 当 插入 一 个 关键 字 时 ， 唯 一 的 困难 发 生 在 接收 该 关键 字 的 节点 已 
经 具有 M 个 关键 字 的 时 候 。 插 和 人 这 个 关键 字 使 得 该 节点 具有 MH 个 关键 字 ， 我 们 可 以 把 它 
分 裂 成 两 个 节点 ， 它 们 分 别 具 有 [「GCM 十 1)7/2 1 个 和 LCM 十 1)/2 ] 个 关键 字 。 由 于 这 使 得 父 节点 
多 出 一 个 儿子 ， 因 此 我 们 必须 检查 这 个 节点 是 否 可 被 父 节 点 接受 ， 如 果 父 节点 已 经 具有 M 个 
儿子 ， 那 么 这 个 父 节点 就 要 被 分 裂 成 两 个 节点 。 我 们 重复 这 个 过 程 直到 找到 一 个 具有 少 于 M 
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个 儿子 的 父 节 点 。 如 果 分 裂 根 节点 ， 那 么 我 们 就 要 创建 一 个 新 的 根 ， 这 个 根 有 两 个 儿子 。 
B 树 的 深度 最 多 是 [ logrw2lN ]。 在 路 径 上 的 每 个 节点 ， 我 们 执行 O(log MD) 的 工作 量 以 [137] 


确定 选择 哪个 分 支 (使 用 折 半 查找 ) ， 但 是 Insert 和 Delete 可 能 需要 O(M) 的 工作 量 来 调 
整 该 节点 上 的 所 有 信息 。 因 此 ， 对 于 每 个 Insert 和 Delete 运算 ， 最 坏 情 形 的 运行 时 间 
HOM logu ND) —OC(OM/log M)log N) ， 不 过 一 次 Find 只 花费 O(log N) 时 间 。 经 验 指出 ， 
从 运行 时 间 考 虑 ，M 的 最 好 (合法 的 ) 选 择 是 M—3 或 M=4; 这 与 上 面 的 界 一 致 ， 它 指出 ， 
当 M 再 增 大 时 插入 和 删除 的 时 间 就 会 增加 。 如 果 我 们 只 关心 主 存 的 速度 ， 则 更 高 阶 的 B 树 
(如 5-9 树 ) 就 没有 什么 优势 了 。 

B 树 实际 用 于 数据 库 系统 ， 在 那里 树 被 存储 在 物理 的 磁盘 上 而 不 是 主 存 中 。 一 般 说 来 ， 
对 磁盘 的 访问 要 比 任何 的 主 存 操作 慢 几 个 数量 级 。 如 果 我 们 使 用 M 阶 B 树 ,那么 磁盘 访问 
次 数 是 O(logv N)。 虽 然 每 次 磁盘 访问 花费 O(log MD) 来 确定 分 支 的 方向 ,但 是 执行 该 操作 
的 时 间 一 般 要 比 读 存 储 器 的 区 块 (block) 所 花费 的 时 间 少 得 多 ， 因 此 可 以 视 为 无 足 轻 重 的 
(只 要 M 选择 得 合理 )。 即 使 在 每 个 节点 执行 更 新 要 花费 O(M) 操 作 时 间 ， 这些 花费 一 般 还 
是 不 大 。 此 时 M 的 值 选择 为 使 得 一 个 内 部 节点 仍然 能 够 装 入 一 个 磁盘 区 块 的 最 大 值 ， 那 么 
一 般 说 来 32 三 M256。 选 择 存储 在 一 片 树 叶 上 的 元 素 的 最 大 个 数 时 ,要 使 得 如 果树 叶 是 满 
的 那么 它 就 装 满 一 个 区 块 。 这 意味 着 ,一 个 记录 总 可 以 在 很 少 的 磁盘 访问 中 找到 ， 因为 典 
型 的 BB 树 的 深度 只 有 2 或 3， 而 根 ( 很 可 能 还 有 第 一 层 ) 可 以 放 在 主 存 中 。 

分 析 指 出 ， 一 棵 也 树 将 被 占 满 In 2 二 69%‰。 当 一 棵 树 得 到 它 的 第 (M 十 1) 项 时 ， 例 程 不 
是 总 去 分 裂 节 点 ， 而 是 搜索 能 够 接纳 新 儿子 的 兄弟 ， 此 时 我 们 就 能 够 更 好 地 利用 空间 。 具 
体 的 细节 可 以 在 参考 文献 中 找到 。 


@ 总 结 


我 们 已 经 看 到 树 在 操作 系统 、 编 译 器 设计 以 及 查找 中 的 应 用 。 表 达 式 树 是 更 一 般 结构 
即 所 谓 的 分 析 树 (parse tree) 的 一 个 小 例子 ,分 析 树 是 编译 器 设计 中 的 核心 数据 结构 。 分 析 
树 不 是 二 叉 树 ， 而 是 表达 式 树 相对 简单 的 扩充 (不 过 ， 建 立 分 析 树 的 算法 却 不 是 那么 简单 ) 。 

查找 树 在 算法 设计 中 是 非常 重要 的 。 它 们 几乎 支持 所 有 有 用 的 操作 ， 而 其 对 数 平均 开 
销 很 小 。 碍 找 树 的 非 递 归 实 现 多 少 要 快 一 些 ， 但 是 递归 实现 更 讲究 、 更 精彩 ， 而 且 易于 理 
解 和 除 错 。 查 找 树 的 问题 在 于 ， 其 性 能 严重 地 依赖 于 输入 ， 而 输入 则 是 随机 的 。 如 果 情 况 
不 是 这 样 ， 则 运行 时 间 会 显著 增加 ， 查 找 树 会 成 为 昂贵 的 链表 。 

我 们 见 到 了 处 理 这 个 问题 的 几 个 方法 。AVL 树 要 求 所 有 节点 的 左 子 树 与 右 子 树 的 高 度 
相差 最 多 是 1。 这 就 保证 了 树 不 至 于 太 深 。 不 改变 树 的 操作 都 可 以 使 用 标准 二 叉 查 找 树 的 程 
序 。 改 变 树 的 操作 必须 将 树 恢 复 。 这 多 少 有 些 复杂 ， 特 别 是 在 删除 时 。 我 们 叙述 了 在 以 
O(log NN) 的 时 间 插 入 后 如 何 将 树 恢复 。 

我 们 还 考察 了 伸展 树 。 在 伸展 树 中 的 节点 可 以 达到 任意 深度 ， 但 是 在 每 次 访问 之 后 树 
又 以 有 些 神秘 的 方式 调整 。 实 际 效果 是 ， 任 意 连 续 M 次 操作 花费 O(M log N) 时 间 ， 它 与 
平衡 树 花费 的 时 间 相 同 。 

与 2- 路 树 或 二 叉 树 不 同 ，B 树 是 平衡 M- 路 树 ， 它 能 很 好 地 匹配 磁盘 ; 其 特殊 情形 是 2- 
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3 树 ， 它 是 实现 平衡 查找 树 的 另 一 种 常用 方法 。 

在 实践 中 ， 所 有 平衡 树 方案 的 运行 时 间 都 不 如 简单 二 又 查找 树 省 时 ( 差 一 个 常数 因子 )， 
但 这 一 般 说 来 是 可 以 接受 的 ， 它 防止 轻易 得 到 最 坏 情形 的 输入 。 第 12 章 讨 论 另 外 一 些 查找 
树 数 据 结 构 并 给 出 详细 的 实现 方法 。 

最 后 注意 : 通过 将 一 些 元 素 插 入 到 查找 树 然后 执行 一 次 中 序 遍 历 ， 我 们 得 到 的 是 排 过 
序 的 元 素 。 这 给 出 排序 的 一 种 O(N log N) 算 法 ,如果 使 用 任何 成 熟 的 查找 树 则 它 就 是 最 坏 
情形 的 界 。 我 们 将 在 第 7 章 看 到 一 些 更 好 的 方法 ， 不 过 ， 这 些 方法 的 时 间 界 都 不 可 能 更 低 。 








Q 练习 


问题 4. 1 到 4.3 参考 图 4-59 中 的 树 。 
4.1 对 于 图 4-59 中 的 树 : 
a 哪个 节点 是 根 ? 
b. 哪些 节点 是 树叶 ? 
4.2 对 于 图 4-59 中 树 上 的 每 一 个 节点 : 
a. 指出 它 的 父 节 点 。 
b. 列 出 它 的 子 节点 。 
c， 列 出 它 的 兄弟 节点 。 , 
d. 计算 它 的 深度 。 
e. 计算 它 的 高 度 。 
4.3 图 4-59 中 树 的 深度 是 多 少 ? 
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4.4 证 明 在 N 个 节点 的 二 叉 树 中 ,存在 N 十 1 个 NULL 指针 代表 N 十 1 个 儿子 。 

4.5 证 明 在 高 度 为 及 的 二 叉 树 中 ， 节 点 的 最 大 个 数 是 27 一 1。 

4.6 满 节点 (full node) 是 具有 两 个 儿子 的 节点 。 证 明 满 节 点 的 个 数 加 1 等 于 非 空 二 叉 树 中 
树叶 的 个 数 。 





4.7 设 二 又 树 有 树叶 li yey yt Uu ,各 树叶 的 深度 分 别 是 d; ,ds a ,dwo 证 明 ， 24 < 1 Jf 
确定 何 时 等 号 成 立 。 


4.8 


9 
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给 出 对 应 图 4-60 中 的 树 的 前 级 表达 式 、 中 缀 表达 式 以 及 后 级 表达 式 。 


mc 


m ^w 
& YH & x 


图 4-60 练习 4.8 中 的 树 


a. 指出 将 3，1，4，6，9，2，5，7 插入 到 初始 为 空 的 二 又 查找 树 中 的 结果 。 

b. 指出 删除 根 后 的 结果 。 

写 出 实现 基本 二 又 查找 树 操作 的 例 程 。 

使 用 类 似 于 指针 链表 实现 法 的 策略 ， 可 以 用 指针 实现 二 又 查找 树 。 使 用 指针 实现 方 

法 写 出 基本 的 二 又 查找 树 例 程 。 

设 欲 做 一 个 实验 来 验证 由 随机 Insert /Delete 操作 对 可 能 引起 的 问题 。 这 里 有 一 个 策 

略 ， 它 不 是 完全 随机 的 ， 但 却 是 足够 封闭 的 。 通 过 插 和 人 从 1 到 M-—aN 之 间 随 机 选 出 的 NN 

个 元 素来 建立 一 棵 具有 N 个 元 素 的 树 。 然 后 执行 NS 对 先 插入 后 删除 的 操作 。 假 设 存在 

例 程 RandomInteger(A，B)， 它 返回 一 个 在 A 和 B 之 间 ( 包 括 A、B) 的 均匀 随机 整数 。 

a. 解释 如 何 生成 在 1 和 M 之 间 的 一 个 随机 整数 ， 该 整数 不 在 这 棵 树 上 (从 而 可 以 进 
行 随机 插入 )。 用 N 和 a 来 表示 这 个 操作 的 运行 时 间 。 

b. 解释 如 何 生 成 在 1 和 M 之 间 的 一 个 随机 整数 ， 该 整数 已 经 存在 于 这 棵 树 上 (从 而 
可 以 进行 随机 删除 )。 这 个 操作 的 运行 时 间 是 多 少 ? 

c. a 的 最 佳 选择 值 是 多 少 ? 为 什么 ? 

编写 一 个 程序 ， 和 赁 经 验 估计 删除 具有 两 个 子 节点 的 下 列 各 方法 : 

a. 用 T, 中 最 大 节点 XX KRE, 递归 地 删除 X. 

b. 交替 地 用 T, 中 最 大 的 节点 以 及 Te 中 最 小 的 节点 来 代替 ， 并 递归 地 删除 适当 的 节点 。 

c 随机 地 选用 五 中 最 大 的 节点 或 Tr 中 最 小 的 节点 来 代替 (递归 地 删除 适当 的 节点 )。 
哪 种 方法 给 出 最 好 的 平衡 ? 哪 种 在 处 理 整 个 操作 序列 过 程 中 人 花费 最 少 的 CPU 
时 间 ? 

证 明 ， 随 机 二 叉 查找 树 的 深度 (最 深 的 节点 的 深度 ) 平 均 为 O(log N)。 

a. 给 出 高 度 为 HAY AVL 树 中 节点 的 最 少 个 数 的 精确 表达 式 。 

b. 高 度 为 15 的 AVL 树 中 节点 的 最 少 个 数 是 多 少 ? 

指出 将 2，1，4，5，9，3，6，7 插入 到 初始 为 空 的 AVL 树 后 的 结果 。 

依次 将 关键 字 1, 2, +, 2—1 插入 到 一 棵 初始 为 空 的 AVL 树 中 。 证 明 所 得 到 的 树 

是 完全 平衡 的 。 

写 出 实现 AVL 单 旋 转 和 双 旋 转 的 其 余 的 过 程 。 
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4.19 SHA AVL 树 进 行 插入 的 非 递归 函数 。 
x4.20 如何 能 够 在 AVL 树 中 实现 ( 非 懒惰 ) 删 除 ? 
4.21 a 为 了 存储 一 棵 NN 节点 的 AVL 树 中 一 个 节点 的 高 度 ， 每 个 节点 需要 多 少 位 ? 


b. 使 8 位 高 度 计数 器 溢出 的 最 小 AVL 树 是 什么 ? 
写 出 执行 双 旋 转 的 函数 ， 其 效率 要 超过 执行 两 个 单 旋转 。 
指出 依 序 访问 图 4-61 的 伸展 树 中 的 关键 字 3，9，1，5 后 的 结果 。 


T» ode 
N N 
w N 





图 4-61 


> 


.24 指出 在 前 一 道 练习 所 得 到 的 伸展 树 中 删除 具有 关键 字 6 的 元 素 后 的 结果 。 
.25 由 节点 1 直到 N=1024 形成 一 棵 只 有 左 儿 子 的 伸展 树 。 
a. 该 树 的 内 部 路 径 的 长 准确 地 说 是 多 少 ? 
xb. 在 执行 Find(1),， Find(2), Find(3), Find(4), Find(5), Finda(6)Z mit & 
内 部 路 径 长 。 
xc. 如果 相继 执行 的 Find 是 连续 的 ， 那 么 什么 时 候 内 部 路 径 长 达到 最 小 ? 


A 


4.26 a. WEH, 如果 在 一 棵 伸展 树 中 按 顺序 访问 所 有 的 节点 ， 那 么 所 得 到 的 结果 是 由 一 连 
串 左 儿子 组 成 的 树 。 
xb. 证 明 ， 如 果 在 一 棵 伸展 树 中 按 顺序 访问 所 有 的 节点 ， 那 么 若 不 考虑 初始 树 ， 则 总 
的 访问 时 间 是 OCN). 


4.27 ”编写 一 个 程序 对 伸展 树 执行 随机 操作 。 计 算 对 序列 执行 的 总 的 旋转 次 数 。 与 AVL Bt 
和 非 平 衡 二 又 查找 树 相 比 ， 其 运行 时 间 如 何 ? 
4.28 编写 一 些 高 效率 的 函数 ， 只 使 用 指向 二 又 树 的 根 的 一 个 指针 工 ， 并 计算 : 
a. 工 中 节点 的 个 数 。 
b. 全 中 树叶 的 片 数 。 
c. 工 中 满 节 点 的 个 数 。 
4.29 写 出 生成 一 棵 N 节点 随机 二 又 查找 树 的 函数 ， 该 树 具 有 从 1 到 N 的 不 同 的 关键 字 。 
你 所 编写 的 例 程 的 运行 时 间 是 多 少 ? 
4.30” 写 出 生成 具有 最 少 节点 、 高 度 为 HORS AVL 树 的 程序 ， 该 函数 的 运行 时 间 是 多 少 ? 
4.31 编写 一 个 函数 ， 使 它 生 成 一 棵 具有 关键 字 从 1812" 一 1 且 高 为 H 的 理想 平衡 二 又 
查找 树 。 该 函数 的 运行 时 间 是 多 少 ? 


4. 32 


4. 33 
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编写 一 个 函数 以 二 又 查找 树 TT 和 两 个 有 序 的 关键 字 k, 和 eS (hi Ske ) 作 为 输入 ， 打 印 

树 中 所 有 满足 & <Key(X)<k, 的 元 素 X。 除 了 可 以 排序 外 ， 不 对 关键 字 的 类 型 做 

任何 假设 。 所 写 的 程序 应 该 以 平均 时 间 O(K 十 log N) 运 行 ， 其 中 K 是 所 打印 的 关键 

字 的 个 数 。 确 定 你 的 算法 的 运行 时 间 界 。 

本 章 中 一 些 更 大 的 二 叉 树 是 由 一 个 程序 自动 生成 的 。 这 可 以 通过 给 树 的 每 一 个 节点 

指定 坐标 (z，>y) ， 围 绕 每 个 坐标 画 一 个 圆圈 (在 某 些 图 片 中 这 可 能 很 难看 请 ) ， 并 将 

每 个 节点 连 到 它 的 父 节 点 上 。 假 设 在 存储 器 中 存 有 一 棵 二 又 查找 树 ( 或 许 是 由 上 面 的 

一 个 例 程 生成 的 ) 并 设 每 个 节点 都 有 两 个 附加 的 域 存放 坐标 。 

a. AAR x 可 以 通过 指定 中 序 遍 历数 来 计算 。 对 于 树 中 的 每 个 节点 写 出 一 个 这 样 的 例 程 。 

b. 坐标 y 可 以 通过 使 用 节点 深度 的 相反 数 算出 。 对 于 树 中 的 每 一 个 节点 写 出 这 样 的 例 程 。 

c. 若 使 用 某 个 虚拟 的 单位 表示 ， 则 所 画图 形 的 具体 尺寸 是 多 少 ? 如 何 调整 单位 使 得 
所 画 的 树 总 是 高 大 约 为 宽 的 三 分 之 二 ? 

d. 证 明 ， 使 用 这 个 系统 没有 交叉 线 出 现 ， 同 时 ， 对 于 任意 节点 X，X 的 左 子 树 的 所 
有 元 素 都 出 现在 X 的 左边 ，X 的 右 子 树 的 所 有 元 素 都 出 现在 X 的 右边 。 

编写 一 个 一 般 的 画 树 程序 ， 该 程序 将 把 一 棵 树 转 变 成 下 列 的 图 -组 装 指令 : 

as Cinele(X, Y) 





b. DrawLine(i, j) 

第 一 个 指令 在 (X， Y) 处 画 一 个 圆 ， 而 第 二 个 指令 则 连接 第 i 个 圆 和 第 j 个 圆 ( 圆 以 所 

画 的 顺序 编号 ) 。 你 或 者 把 它 写成 一 个 程序 并 定义 某 种 输入 语言 ， 或 者 把 它 写成 一 个 

函数 ， 该 函数 可 以 被 任何 程序 调用 。 你 的 程序 的 运行 时 间 是 多 少 ? 

编写 一 个 例 程 以 层 序 (level-order) 列 出 二 叉 树 的 节点 。 先 列 出 根 ， 然 后 列 出 深度 为 1 

的 节点 ， 再 列 出 深度 为 2 的 节点 ， 等 等 。 必 须要 在 线性 时 间 内 完成 这 个 工作 。 证 明 

你 的 时 间 界 。 

a 指出 将 下 列 关 键 字 插入 到 初始 为 空 的 2-3 树 后 的 结果 : 3, 1, 4, 5, 9, 2, 6, 8, 
Ts 0$ 

b. 指出 在 (a) 建 立 的 2-3 树 中 删除 0， 然后 再 删除 9 所 得 到 的 结 


.37 xa 写 出 向 一 棵 B 树 进行 插入 的 例 程 。 
xb. 写 出 从 一 棵 B 树 执行 删除 的 例 程 。 当 一 个 关键 字 被 删除 时 ， 是 否 要 更 新 内 部 节点 


的 信息 ? 


*c. 修改 你 的 插入 例 程 使 得 如 果 想 要 向 一 个 已 经 有 M 项 的 节点 添加 元 素 ， 则 在 分 裂 该 


节点 以 前 要 执行 搜索 具有 少 于 M 个 儿子 的 兄弟 的 工作 。 
M 阶 B* 树 是 其 每 个 内 部 节点 的 儿子 数 在 2M /3 和 M 之 间 的 B 树 。 描 述 一 种 向 B* 树 
进行 插入 的 方法 。 
指出 如 何 用 儿子 /兄弟 指针 实现 方法 表示 图 4-62 中 的 树 。 
编写 一 个 过 程 使 该 过 程 遍历 一 棵 用 儿子 /兄弟 链 存储 的 树 。 
如 果 两 棵 二 叉 树 或 者 都 是 空 村 ,或 者 非 空 且 具 有 相似 的 左 子 树 和 右 子 树 ， 则 这 两 棵 
二 又 树 是 相似 的 。 编 写 一 个 函数 以 确定 两 棵 二 叉 树 是 否 是 相似 的 。 


us 
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4-62 练习 4. 39 中 的 树 


4.42 ”如 果树 T, 通过 交换 其 ( 某 些 ) 节 点 的 左右 儿子 变换 成 树 T, MWER TT, Ts 是 同 构 
的 (isomorphic)。 例 如 ， 图 4-63 中 的 两 棵 树 是 同 构 的 ， 因 为 交换 A、B、G 的 儿子 而 
不 交换 其 他 节点 的 儿子 后 这 两 棵 树 是 相同 的 。 
a. 给 出 一 个 多 项 式 时 间 算 法 以 决定 是 否 两 棵 树 是 同 构 的 。 
xb. 你 的 程序 的 运行 时 间 是 多 少 ( 存 在 一 个 线性 的 解决 方案 吗 )? 





图 4-63 两 棵 同 构 的 树 ‘ 


4.43 xa. 证 明 ， 经 过 一 些 AVL Shee, (ES VAR T, 可 以 变换 成 另 一 棵 (具有 相 
同 关 键 字 的 ) 查 找 树 T,。 
xb. 给 出 一 个 算法 平均 用 O(N log N) 次 旋转 完成 这 种 变换 。 
xxe 证 明 该 变换 在 最 坏 的 情形 下 可 以 用 O(NN) 次 旋转 完成 。 

4.44 设 我 们 想 要 把 运算 FindKth 添加 到 指令 集中 。 该 运算 Findkth(T, ikea T 
中 具有 第 i 个 最 小 关键 字 的 元 素 。 假 设 所 有 的 元 素 具 有 互 异 的 关键 字 。 解 释 如 何 
修改 二 叉 树 以 平均 O(log N) 时 间 支 持 这 种 运算 ， 而 又 不 影响 任何 其 他 操作 的 时 
间 界 。 

445 由 于 具有 六 个 节点 的 二 叉 查 找 树 有 N+1 个 NULL 指针 ， 因 此 在 二 叉 查找 树 中 指定 
给 指针 信息 的 空间 的 一 半 被 浪费 了 。 设 若 一 个 节点 有 一 个 NULL 左 儿子 ,我们 使 它 
的 左 儿 子 指向 它 的 中 组 前 驱 (inorder predecessor) ， 若 一 个 节点 有 一 个 NULL 右 儿 子 ， 
我 们 让 它 的 右 儿 子 指向 它 的 中 绥 后 继 (inorder successor)。 这 就 叫 作 线索 树 (threaded 
tree), ， 而 附加 的 指针 就 叫 作 线索 (thread) 。 

a. 我 们 如 何 能 够 从 实际 的 儿子 指针 中 区 分 出 线索 ? 
b. 编写 对 由 上 面 描述 的 方式 形成 的 线索 树 进行 插入 和 删除 的 例 程 。 
c. 使 用 线索 树 的 优点 是 什么 ? 

4.46 二 又 查找 树 预先 假设 搜索 是 基于 每 个 记录 只 有 一 个 关键 字 。 设 我 们 想 要 能 够 执行 或 
者 基于 关键 字 Key 或 者 基于 关键 字 Key: 的 查找 。 

a. 一 种 方法 是 建立 两 棵 分 离 的 二 叉 树 。 这 需要 多 少 额 外 的 指针 ? 














b. 另 一 种 方法 是 使 用 2-d 树 。2-d 树 类 似 于 二 又 树 ， 其 不 同 之 处 在 于 ， 在 偶数 层 用 
Key: KM, MEARE Key: KI Mo 4-64 显示 一 棵 2-d 树 ， 以 名 (first 
name) 和 姓 (last name) 作为 关键 字 对 第 二 次 世界 大 战 后 的 美国 总 统 进行 查找 。 总 
统 的 姓名 是 按照 年 代 顺 序 插入 的 (Truman,， Eisenhower, Kennedy, Johnson, 
Nixon，Ford，Carter，Reagan，Bush，Clinton)。 编 写 一 个 向 一 棵 2-d 树 进 行 插 
和 人 的 例 程 。 

c. 编写 一 个 高 效 的 过 程 ， 该 过 程 打印 同时 满足 约束 Low, X Key: & Highi 和 Low: < 
Key: <High, 的 树 的 所 有 记录 。 

d. 指出 如 何 扩充 2-d 树 以 处 理 多 于 两 个 的 搜索 关键 字 。 所 得 到 的 树 叫 作 k-d 树 。 


Harry Truman ^ 
zt i ae m 
RO EI -a o, Boc 
Dwight Eisenhower ) € John Kennedy 
a E 
p Say ze ee A 
George Bush Gerald Ford Lyndon Johnson Richard Nixon 
D a E i 7 ————— - RR 
x. = am 2 ona 
Bill Clinton ` Jimmy Carter | Ronald Reagan 


图 4-64 一 棵 2-d 树 
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关于 二 叉 树 的 更 多 信息 (特别 是 树 的 数学 性 质 ) 可 以 在 Knuth[23，24] 中 找到 。 

有 几 篇 论文 谈 及 由 二 叉 查 找 树 中 的 有 偏 删 除 (biased deletion ) 算 法 引起 的 平衡 不 足 问 
题 。Hibbard[20] 提 出 原始 删除 算法 并 确立 了 一 次 删除 保持 树 的 随机 性 。 文 献 [21] 和 [5] 分 
别 对 只 有 三 个 节点 的 树 和 四 个 节点 的 树 进行 了 全 面 的 分 析 。Eppinger[15] 提 供 了 非 随 机 性 
的 早期 经 验 性 的 证 据 ， 而 Culberson 和 Munro[11，12] 则 提供 了 某 些 解析 论证 (但 不 是 对 泥 
杂 插 入 和 删除 的 一 般 情形 的 完整 证 明 )。 

AVL 树 由 Adelson-Velskii 和 Landis[1] 提 出 。AVL 树 的 模拟 结果 以 及 当 AVL 树 的 高 
度 不 平衡 允许 最 多 到 & 时 的 各 种 变化 在 文献 [22] 中 讨论 。AVL 树 的 删除 算法 可 以 在 文献 
[24] 中 找到 。 在 AVL 树 中 平均 搜索 开销 的 分 析 是 不 完全 的 ,但 是 ,文献 [25] 中 得 出 某 些 
结果 。 

文献 [3，9] 考 虑 了 类 似 本 书 4. 5. 1 节 类 型 的 自 调整 树 。 伸 展 树 在 文献 [29] 中 做 了 描述 。 

B 树 首先 出 现在 文献 [6] 中 。 原 始 论文 中 所 描述 的 实现 方法 允许 数据 存储 在 内 部 节点 或 者 
树叶 上 。 我 们 描述 过 的 数据 结构 有 时 叫 作 B 树 。 文 献 [10] 对 不 同类 型 的 B 树 进行 了 综合 分 
析 。 文 献 [18] 报 告 了 各 种 方案 的 经 验 性 结果 。2-3 RAD B 树 的 分 析 可 以 在 文献 [4，14，33] 中 
找到 。 

练习 4. 14 使 人 误 以 为 很 难 。 一 种 解法 可 以 在 文献 [16] 中 找到 。 练 习 4. 26 取 自 文献 
[32]。 在 练习 4. 38 中 描述 的 B^ 树 的 信息 可 以 在 文献 [13] 中 找到 。 练 习 4. 42 取 自 文献 [2] 。 
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练习 4. 43 要 使 用 2N 一 6 次 旋转 ， 解 法 在 文献 [30] 中 给 出 。 练 习 4. 45 中 使 用 的 线索 首先 在 
文献 [28] 中 提出 。k-d 树 的 最 早 提出 是 在 文献 [7] 中 ， 其 主要 缺点 在 于 删除 和 平衡 都 有 困难 。 
文献 [8] 讨 论 了 k-d 树 以 及 其 他 一 些 用 于 多 维 搜索 的 方法 ; 本 书 第 12 章 也 进行 了 简要 的 


讨论 。 


男 外 一 些 流行 的 平衡 查找 树 是 红 黑 树 ”和 赋 权 平衡 树 ” 。 在 第 12 章 可 以 找到 更 多 的 


平衡 树 方案 ， 此 外 也 可 以 在 文献 L[17，26 ，31] 中 找到 。 
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我 们 在 第 4 章 讨论 了 查找 树 ADT， 它 允许 对 一 组 元 素 进 行 各 种 操作 。 本 章 讨论 散 列 表 
(hash table)ADT， 不 过 它 只 支持 二 又 查找 树 所 允许 的 一 部 分 操作 。 

散 列表 的 实现 常常 叫 作 散 列 (hashing)。 散 列 是 一 种 以 常数 平均 时 间 执行 插入 、 删 除 和 查 
找 的 技术 。 但 是 ， 那 些 需要 元 素 间 任何 排序 信息 的 操作 将 不 会 得 到 有 效 的 支持 。 因 此 ， 诸 如 
FindMin, FindMax 以 及 以 线性 时 间 将 排 过 序 的 整个 表 进 行 打印 的 操作 都 是 散 列 所 不 支持 的 。 

这 章 的 中 心 数据 结构 是 散 列 表 ， 我 们 将 : 

e 看 到 实现 散 列 表 的 几 种 方法 。 

© 分 析 比 较 这 些 方法 。 

o 介绍 散 列 的 多 种 应 用 。 

。 将 散 列表 和 二 叉 查 找 树 进行 比较 。 


理想 的 散 列表 数据 结构 只 不 过 是 一 个 含有 关键 字 的 具有 固定 大 小 的 数组 。 典 型 情况 下 ， 
一 个 关键 字 就 是 一 个 带 有 相关 值 ( 例 如 工资 信息 ) 的 字符 串 。 我 们 把 表 的 大 小 记 作 Table- 
size， 并 将 其 理解 为 散 列 数据 结构 的 一 部 分 而 不 仅仅 是 浮动 于 全 局 的 某 个 变量 。 通 常 的 习 
惯 是 让 表 从 0 到 Tablesize 一 1 变化 ， 稍 后 我 们 就 会 明白 为 什么 要 这 样 。 

将 每 个 关键 字 映 射 到 从 0 到 mablesize 一 1 这 个 范围 中 的 ——~ 





























散 列 到 3. phil 散 列 到 4, dave 散 列 到 6, mary 散 列 到 7。 

这 就 是 散 列 的 基本 想法 。 剩 下 的 问题 则 是 要 选择 一 个 画 
数 ， 决 定 当 两 个 关键 字 散 列 到 同一 个 值 的 时 候 ( 称 为 冲突 (col- 
lision) ) 应 该 做 什么 以 及 如 何 确定 散 列 表 的 大 小 。 





某 个 数 ， 并 且 放 到 适当 的 单元 中 。 这 个 映射 就 叫 作 散 列 函数 | 
(hash function) ， 理 想 情 况 下 它 应 该 运算 简单 并 且 应 该 保证 任何 2 
两 个 不 同 的 关键 字 映 射 到 不 同 的 单元 。 不 过 ， 这 是 不 可 能 的 ， 3 john 25000 
因为 单元 的 数目 是 有 限 的 ， 而 关键 字 实际 上 是 无 穷 无 尽 的。 天 : pe 
此 ， 我 们 寻找 一 个 散 列 函 数 ， 该 函数 要 在 单元 之 间 均 匀 地 分 配 pem 
关键 字 。 图 5-1 是 一 个 典型 的 理想 情况 。 在 这 个 例子 中 , john 7 mary 28200 

8 

9 











5-1 一 个 理想 的 散 列表 


5.2 ie Si Be 


如 果 输 入 的 关键 字 是 整数 ， 则 一 般 合 理 的 方法 就 是 直接 返回 “Key mod Tablesize" 
的 结果 ， 除 非 Key 碰巧 具有 某 些 不 理想 的 性 质 。 在 这 种 情况 下 ， 散 列 函数 的 选择 需要 仔细 
考虑 。 例 如 ， 若 表 的 大 小 是 10 而 关键 字 都 以 0 为 个 位 ， 则 此 时 上 述 标 准 的 散 列 函数 就 是 一 
个 不 好 的 选择 。 其 原因 我 们 将 在 后 面 看 到 ， 而 为 了 避免 上 面 那样 的 情况 ， 好 的 办 法 通常 是 
保证 表 的 大 小 是 素数 。 当 输入 的 关键 字 是 随机 整数 时 ， 散 列 函 数 不 仅 算 起 来 简单 而 且 关 键 
字 的 分 配 也 很 均匀 。 


第 5 章 dk 列 


通常 ， 关 键 字 是 字符 串 ; 在 这 种 情形 下 ， 散 列 函 数 需 要 仔细 地 选择 。 
一 种 选择 方法 是 把 字符 串 中 字符 的 ASCII 码 值 加 起 
来 。 在 图 5-2 中 ,我 们 声明 类 型 Index， 它 是 散 列 顶 数 的 
返回 值 类 型 。 图 5-3 实现 该 想法 并 用 典型 的 C 方式 通过 将 uc 
字符 逐个 相 加 来 处 理 整个 字符 串 。 
图 5-3 中 描述 的 散 列 函数 实现 起 来 简单 而 且 能 够 很 快 地 算出 答案 。 不 过 ， 如 果 表 很 大 ， 
则 函数 将 不 会 很 好 地 分 配 关 键 字 。 例 如 ， 设 TableSize- 10 007(10 007 是 素数 )， 并 设 所 
有 的 关键 字 至 多 8 个 字符 长 。 由 于 char 型 量 的 值 最 多 是 127， 因 此 散 列 函数 只 能 假设 值 在 
0 和 1016 之 间 ， 其 中 1016 王 127 久 88。 显然 这 不 是 一 种 均匀 的 分 配 。 
一 个 散 列 函数 由 图 5-4 表示 。 这 个 散 列 函数 假设 Key 至 少 有 两 个 字符 外 加 NULL 结束 





typedef unsigned int Index; 





由 散 列 函数 返回 的 类 型 





符 。 值 27 表示 英文 字母 表 的 字母 个 数 外 加 e 
一 个 空格 ， 而 729—2T', 该 函数 只 考察 前 De const char *Key, int TableSize ) 
三 个 字符 ， 但 是 ， 假 如 它们 是 随机 的 ， 而 i unsigned int HashVal = 0; 
end \ 像 前 面 那样 还 是 10007. WARNI | 7 in while( *Key != '\0' ) 

会 得 到 一 个 合理 的 均衡 分 配 。 可 不 巧 的 | 77 p Ai ai 
是 ， 英 文 不 是 随机 的 。 虽 然 3 个 字符 (忽略 f= 3x7 return HashVal % TableSize; 











空格 ) 有 26 = 17 576 种 可 能 的 组 合 ， 但 查 
验 词汇 量 oe Sq 图 5-3 — A f8 S RO ERU of Ai 

FE I £v cS 只 有 2851 种 。 即 使 这 些 组 合 没有 冲突 ， 也 不 过 只 有 表 的 28% 被 真正 散 
列 到 。 因 此 ， nome. 但 是 当 散 列表 足够 大 的 时 候 这 个 函数 还 是 不 合适 的 。 





Index 
Hash( const char *Key, int TableSize ) 
{ 
return ( Key[ 0 ] + 27 * Key[ 1 ] + 729 * Key[ 2] D 
% TableSize; 
} 











图 5-5 列 出 了 散 列 函数 的 第 3 种 尝试 。 这 个 散 列 函数 涉及 关键 字 中 的 所 有 字符 ， 并 且 一 


般 可 以 分 布 得 很 好 ( 它 计 算 S Key[LKeySize 一 ;一 1]。32 ， 并 将 结果 限制 在 适当 的 范 


1=0 





Index 
Hash( const char *Key, int TableSize ) 
{ 

unsigned int HashVal = 0; 


/* 1%/ while( *Key != 'NO' ) 
/* 2*y HashVal = ( HashVal << 5 ) + *Key++; 


/* 3*/ return HashVal % TableSize; 
! 











图 5-5 一 个 好 的 散 列 函数 
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围 内 )。 程 序 根据 Horner 法 则 计算 一 个 (32 H) ni s ewe. HM. Hh, — + 27k, + 
27 b, 的 另 一 种 方式 是 借助 于 公式 h COR) X27 +k) X27+k, 进行 。Horner 法 则 将 其 扩 
展 到 用 于 nn 次 多 项 式 。 

我 们 之 所 以 用 32 代替 27， 是 因为 用 32 作 乘 法 不 是 真 的 去 乘 ， 而 是 移动 二 进 制 的 5 位 。 
为 了 加 速 ， 在 程序 第 2 行 的 加 法 可 以 用 按 位 异 或 来 代替 。 

图 5-5 所 描述 的 散 列 函数 就 表 的 分 布 而 言 未 必 是 最 好 的 ,但 是 确实 具有 极其 简单 的 优点 
(如 果 允 许 溢出 ， 那 么 速度 也 很 快 ;。 如 果 关 键 字 特别 长 ， 那 么 该 散 列 函 数 计算 起 来 将 会 花费 
过 多 的 时 间 ， 不 仅 如 此 ， 前 面 的 字符 还 会 左 移 出 最 终 的 结果 。 在 这 种 情况 下 ,通常 的 做 法 是 
不 使 用 所 有 的 字符 。 此 时 关键 字 的 长 度 和 性 质 将 影响 选择 。 例 如 ， 关 键 字 可 能 是 完整 的 街道 
地 址 ， 散 列 函 数 可 以 包括 街道 地 址 的 几 个 字符 ， ee 有 些 
程序 设计 人 员 通 过 只 使 用 奇数 位 置 上 的 字符 来 实现 他 们 的 散 列 函数 ， 这 里 有 这 么 一 层 想法 : 
用 计算 散 列 函数 节省 下 的 时 间 来 补偿 由 此 产生 的 对 均匀 分 布 的 函数 的 轻微 干扰 。 

剩 下 的 主要 编程 细节 是 解决 冲突 的 消除 问题 。 如 果 当 一 个 元 素 被 插入 处 另 一 个 元 素 已 
经 存在 ( 散 列 值 相同 )， 那 么 就 产生 一 个 冲突 ， 这 个 冲突 需要 消除 。 解 决 这 种 冲突 的 方法 有 
几 种 ， 我 们 将 讨论 其 中 最 简单 的 两 种 : 分 离 链 接 法 和 开放 定 址 法 。 


5.3 分 离 链 接 法 


解决 冲突 的 第 一 种 方法 通常 叫 作 分 离 链接 法 (separate chai- — B 
































sing). JE SLAG MONS MANTEREEN E des ar 
为 方便 起 见 ， 这 些 表 都 有 表 头 ， 因 此 ， 表 的 实现 与 第 3 章 中 的 实 ?| | 
现 方法 相同 。 如 果 空间 很 紧 ， 则 更 可 取 的 方法 是 避免 使 用 这 些 表 0 Drs unl 
头 。 本 节 假 设 关键 字 是 前 10 个 完全 平方 数 并 设 散 列 函 数 就 是 oien l 
Hash(X) 一 Xmod 10。( 表 的 大 小 不 是 素数 ， 用 在 这 里 是 为 了 简单 6| HeH 
起 见 .) 图 5-6 做 出 更 清晰 的 解释 。 IE 

为 执行 Find， 我 们 使 用 散 列 函 数 来 确定 究 竞 考察 哪个 表 。 。% I THe. 





此 时 我 们 以 通常 的 方式 遍历 该 表 并 返回 所 找到 的 被 查找 项 所 在 位 
置 。 为 执行 Insert, 我 们 遍历 一 个 相应 的 表 以 检查 该 元 素 是 否 
已 经 处 在 适当 的 位 置 ( 如 果 要 插入 重复 元 ， 那 么 通常 要 留 出 一 个 额外 的 域 ， 这 个 域 当 重复 元 
出 现时 增 1)。 如 果 这 个 元 素 是 个 新 的 元 素 ， 那 么 或 者 插入 到 表 的 前 端 ， et 
尾 ， 哪 个 容易 就 执行 哪个 。 当 编写 程序 的 时 候 这 是 最 容易 寻 址 的 一 种 。 有 时 将 新 元 素 插入 
到 表 的 前 端 不 仅 因 为 方便 ， 而且 还 因为 新 近 插 入 的 元 素 最 有 可 能 最 先 被 访问 。 

实现 分 离 链 接 法 所 需要 的 类 型 声明 在 图 5-7 中 示 出 。 图 中 的 ListNode 结构 与 第 3 章 中 的 
链表 声明 相同 。 图 中 的 散 列 表 结 构 包 括 一 个 链表 数组 (以 及 数组 中 的 链表 的 个 数 )， 它们 在 散 
列表 结构 初始 化 时 动态 分 配 空间 。 此 处 的 HashTable 类 型 就 是 指向 该 结构 的 指针 类 型 。 

注意 ，TheList 域 实际 上 是 一 个 指向 指向 ListNode 结构 的 指针 的 指针 。 如 果 不 使 用 
这 些 typedef， 那 可 能 会 相当 混乱 。 


图 5-6 ”分离 链接 散 列表 





#ifndef _HashSep_H 


struct ListNode; 
typedef struct ListNode *Position; 
struct HashTbl; 
typedef struct HashTb] *HashTable; 


HashTable InitializeTable( int TableSize ); 

void DestroyTable( HashTable H ); 

Position Find( ElementType Key, HashTable H ); 

void Insert( ElementType Key, HashTable H ); 
ElementType Retrieve( Position P ); 

/* Routines such as Delete and MakeEmpty are omitted */ 


#endif /* _HashSep_H */ 


/* Place in the implementation file */ 
struct ListNode 
{ 

ElementType Element; 

Position Next; 


he 
typedef Position List; 


/* List *TheList will be an array of lists, allocated later */ 
/* The lists use headers (for simplicity), */ 
/* though this wastes space */ 
struct HashTbl 
{ 

int TableSize; 
, List *TheLists; 

h 











图 5-7 分离 链接 散 列 表 的 类 型 声明 


图 5-8 列 出 初始 化 函数 ， 它 用 到 与 栈 的 数组 实现 中 相同 的 想法 。 第 4 一 6 行 给 一 个 散 列 
表 结 构 分 配 空 间 。 如 果 空 间 人 允许 ， 则 五 将 指 加 一 个 结构 ， 该 结构 包含 一 个 整数 和 指向 一 个 
表 的 指针 。 第 7 行 设 置 表 的 大 小 为 一 素数 ， 而 第 8 一 10 行 则 试图 指定 List 的 一 个 数组 。 由 
T List 被 定义 为 一 个 指针 ， 因 此 结果 为 指针 的 数组 。 

假如 List 的 实现 不 用 表 头 ， 那 么 我 们 就 可 以 到 此 为 止 了 。 但 是 我 们 使 用 了 表 头 ， 因 
此 必须 给 每 个 表 分 配 一 个 表 头 并 设置 它 的 Next 域 为 NULL。 这 由 第 11—15 行 实现 。 当 然 ， 
第 12~15 行 可 以 用 语句 

H->TheLists[i]=MakeEmpty (); 
代替 。 虽 然 我 们 没有 选择 使 用 这 条 语句 ， 但 是 因为 该 例 中 它 胜 过 使 程序 尽 可 能 自 包 含 ， 所 


以 它 当 然 值 得 考虑 。 这 个 程序 的 一 个 低 效 之 处 在 于 第 12 行 上 的 malloc 执行 了 H-> Ta- 
bleSize 次。 这 可 以 通过 在 循环 出 现 之 前 调用 一 次 malloc 操作 


H-» TheLists-malloc(H-» TableSize*sizeof (struct ListNode) ); 
代替 第 12 行 来 避免 。 第 16 行 返 回 H., 

对 Find(CKey， 万 ) 的 调用 将 返回 一 个 指针 ， 该 指针 指向 包含 Key 的 那个 单元 。 实 现 它 
的 程序 在 图 5-9 中 示 出 。 注 意 ， 第 2 一 5 行 等 同 于 第 3 章 中 给 出 的 执行 Fina 的 程序 。 因 此 ， 
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第 3 章 中 表示 ADT 的 实现 方法 可 以 用 到 这 里 。 记 住 ， 如 果 ElementType 是 一 个 字符 串 ， 
那么 比较 和 赋值 必须 相应 地 使 用 strcmp 和 strcpy 来 进行 。 























HashTable 
InitializeTable( int TableSize ) 
{ 
HashTable H; 
int i; 
/* 1*7 if( TableSize < MinTableSize ) 
yE 247 Error( “Table size too small" ); 
/& 3*7 return NULL; 
} 
/* Allocate table */ 
y= ux H = malloc( sizeof( struct HashTbl ) ); 
[2 B*/ if(C H == NULL ) 
/* 6*/ FatalError( "Out of space!!!" ); 
/*. 7*7 H-»TableSize - NextPrime( TableSize ); 
/* Allocate array of lists */ 
/* 8*/ H->TheLists = malloc( sizeof( List ) * H-»TableSize ); 
fe 9*7 if( H->TheLists == NULL ) 
/*10*/ FatalError( "Out of space!!!" ); 
/* Allocate list headers */ 
/*11*/ for( i = 0; i < H-»TableSize; i++ ) 
{ 
/*12*/ H->TheLists[ i ] = malloc( sizeof( struct ListNode ) ); 
/*13*/ if( H->TheLists[ i ] == NULL ) 
/*14*/ FatalError( "Out of space!!!" ); 
else 
/*15*/ H->TheLists[ i ]->Next = NULL; 
} 
/*16*/ return H; 
} 
图 5-8 分 离 链 接 散 列表 的 初始 化 例 程 
Position 
Find( ElementType Key, HashTable H ) 
{ 
Position P; 
List Lt 
/* 1*/ L = H->TheLists[ Hash( Key, H-»TableSize ) ]; 
[* 2*/ P = L-»Next ; 
/* 3*/ while( P != NULL && P->Element != Key ) 
/* Probably need strcmp!! */ 
£* 4*7 P = P->Next; 
/[* 5*/ return P; 
} 








下 一 个 是 插入 例 程 。 如 果 要 插入 的 项 已 经 存在 ， 那 么 我 们 就 什 


图 5-9 分 离 链 接 散 列表 的 Fina 例 程 


不 做 ; 否则 我 们 把 


么 也 
它 放 到 表 的 前 端 ( 见 图 5-10) ”该 元 素 可 以 放 在 表 的 任何 地 方 ， 此 处 这 样 做 是 最 方便 的 。 注 





O AFP 5-6 中 的 表 是 通过 搬入 到 表 的 末端 建立 的 ， 因 此 图 5-10 中 的 程序 将 产生 一 个 将 图 5-6 中 的 表 倒 转 过 来 


AY # 


意 ， 插 入 到 表 的 前 端的 程序 基本 上 等 同 于 第 3 章 中 使 用 链表 实现 Push 的 程序 。 如 果 第 3 章 

中 的 那些 ADT 都 已 经 仔细 地 实现 了 ,那么 它们 就 可 以 用 到 这 里 。 
图 5-10 中 的 插入 例 程 写 得 多 少 有 些 不 好 ， 因 为 它 计算 了 两 次 散 列 丽 数 。 多 余 的 计算 总 

是 不 好 的 ， 因 此 ， 如 果 这 些 散 列 例 程 真 的 构成 程序 运行 时 间 的 重要 部 分 那么 这 个 程序 就 155 

应 该 重 写 。 LE 
BER LR bt AS p MLB B e BE. Ded AT] AR fe x EGA, Se CR AE 

例 程 中 不 包括 删除 操作 ， 那 么 最 好 不 要 使 用 表 头 ， 因 为 使 用 表 头 不 仅 不 能 简化 问题 而 且 还 

要 浪费 大 量 的 空间 。 我 们 也 把 它 作为 王道 练习 留 给 读者 。 








void 
Insert( ElementType Key, HashTable H ) 
Position Pos, NewCell; 
Last L$ 
/* 1*7 Pos = Find( Key, H ); 
/* 2*/ if( Pos == NULL ) /* Key is not found */ 
{ 
/* 3*/ NewCell = malloc( sizeof( struct ListNode ) ); 
f* sd if( NewCell == NULL ) 
/* S*/ FatalError( "Out of space!!!" ); 
else 
/* 6*/ L = H->TheLists[ Hash( Key, H->TableSize ) ]; 
y* fey NewCell-»Next = L->Next; 
J Be/ NewCe11->Element = Key; /* Probably need strcpy! */ 
f= g*/ L->Next = NewCell; 
s, 
! 
| } 
} 











5-10 ”分 离 链 接 散 列表 的 Insert WE 


除 链表 外 ， 任 何 的 方案 都 有 可 能 用 来 解决 冲突 现象 一 一 一 棵 二 又 查找 树 甚 至 另外 一 个 
散 列表 均 可 胜任 ,但 是 我 们 期 望 如 果 表 大 ， 同 时 散 列 函数 好 ， 那 么 所 有 的 表 就 应 该 短 ， 这 
样 就 不 至 于 进行 任何 复杂 的 尝试 了 。 

我 们 定义 散 列表 的 装填 因子 (load factor)4 为 散 列表 中 的 元 素 个 数 与 散 列 表 大 小 的 比值 。 
在 上 面 的 例子 中 ,4 二 1.0。 表 的 平均 长 度 为 +。 执 行 一 次 查找 所 需要 的 工作 是 计算 散 列 函数 
值 所 需要 的 常数 时 间 加 上 遍历 表 所 用 的 时 间 。 在 一 次 不 成 功 的 查找 中 ,遍历 的 链接 数 平均 
为 4( 不 包括 最 后 的 NULL 链接 )。 成 功 的 查找 则 需要 遍历 大 约 1 十 (4/2) 个 链接 ; 它 保证 必然 
会 遍历 一 个 链接 (因为 查找 是 成 功 的 ) ， 而 我 们 也 期 望 沿 着 一 个 表 中 途 就 能 找到 匹配 的 元 素 。 
这 就 指出 ， 表 的 大 小 实际 上 并 不 重要 ， 而 装填 因子 才 是 重要 的 。 分 离 链接 散 列 的 一 般 法 则 
是 使 得 表 的 大 小 尽量 与 预料 的 元 素 个 数 差 不 多 ( 换 句 话说， 让 、》 兰 1)。 正 如 前 面 提 到 的 ， 使 
表 的 大 小 是 素数 以 保证 一 个 好 的 分 布 ， 这 也 是 一 个 好 的 想法 。 


5.4 开放 定 址 法 
分 离 链接 散 列 算法 的 缺点 是 需要 指针 ， 由 于 给 新 单元 分 配 地 址 需要 时 间 ， 因 此 这 就 导致 
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P 


算法 的 速度 多 少 有 些 减 慢 ， 同 时 算法 实际 上 还 要 求实 现 另 一 种 数据 结构 。 除 使 用 链表 解决 冲 
窗外 ， 开 放 定 址 散 列 法 (open addressing hashing) 是 另外 一 种 用 链表 解决 冲突 的 方法 。 在 开放 定 
址 散 列 算 法 系统 中 ， 如 果 有 冲突 发 生 ， 那 么 就 要 尝试 选择 另外 的 单元 ， 直 到 找 出 空 的 单元 为 
止 。 更 一 般 地 ， 单 元 ho(X)，hi(X)，h,(X),，…， 相 继 试 选 ， 其 中 h;(X)= 二 (Hash(X) 十 F(i)) 
mod TableSize, H F(CO) 王 0。 函 数 下 是 冲突 解决 方法 。 因 为 所 有 的 数据 都 要 置信 表 内 ， 所 
以 开放 定 址 散 列 法 所 需要 的 表 要 比分 离 链 接 散 列 用 的 表 大 。 一 般 说 来 ， 对 开放 定 址 散 列 算法 
来 说 ， 装 填 因 子 应 该 低 于 4 二 0.5。 现 在 我 们 就 来 考察 三 个 通常 的 冲突 解决 方法 。 


5.4.1 线性 探测 法 

在 线性 探测 法 中 ， 函 数 正 是 ;的 线性 函数 ， 典 型 情形 是 PG) =i, ROMY FBTR ET 
单元 (必要 时 可 以 绕 回 ) 以 查找 出 一 个 空 单元 。 图 5-11 显示 使 用 与 前 面相 同 的 散 列 函数 将 诸 关 
键 字 {89，18，49，58，69} 插 入 一 个 散 列 表 的 情况 ， 而 此 时 的 冲突 解决 方法 就 是 FC(2) 二 i。 
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图 5-11 每 次 插入 后 使 用 线性 探测 得 到 的 开放 定 址 散 列 表 


第 一 个 冲突 在 插入 关键 字 49 时 产生 一 一 它 被 放 和 下 一 个 空闲 地 址 ， 即 地 址 0， 该 地 址 
是 开放 的 。 关 键 字 58 依次 和 18, 89, 49 发 生 冲 突 ， 试 选 三 次 之 后 才 找 到 一 个 空 单元 。 对 
69 的 冲突 用 类 似 的 方法 处 理 。 只 要 表 足 够 大 ， 总 能 够 找到 一 个 自由 单元 , 但 是 如 此 花费 的 
时 间 是 相当 多 的 。 更 糟 的 是 ， 即 使 表 相 对 较 空 ， 这 样 占 据 的 单元 也 会 开始 形成 一 些 区 块 ， 
其 结果 称 为 一 次 聚集 (Primary clustering)， 于 是 ， 散 列 到 区 块 中 的 任何 关键 字 都 需要 多 次 
试 选 单元 才能 解决 冲突 ， 然 后 该 关键 字 被 添加 到 相应 的 区 块 中 。 

虽然 我 们 不 在 这 里 进行 具体 计算 ， 但 是 可 以 证 明 ， 使 用 线性 探测 的 预期 探测 次 数 


对 于 插入 和 不 成 功 的 查找 来 说 大 约 为 孝 C1 十 1/C1 7A). 而 对 于 成 功 的 查找 来 说 则 是 


方 (1 十 1/(1 一 4))。 一 些 相关 的 计算 多 少 有 些 复杂 。 从 程序 中 容易 看 出 ， 插 入 和 不 成 功 


查找 需要 相同 次 数 的 探测 。 略 加 思考 不 难得 出 ,成功 查 找 应 该 比 不 成 功 查找 平均 花费 
较 少 的 时 间 。 


如 果 聚 集 不 算是 问题 ,那么 对 应 的 公式 就 不 难得 到 。 我 们 假设 有 一 个 很 大 的 表 ， 并 设 
每 次 探测 都 与 前 面 的 探测 无 关 。 对 于 随机 冲突 解决 方法 而 言 ， 这 些 假设 是 成 立 的 ， 并 且 当 4 
不 是 非常 接近 于 1 时 也 是 合理 的 。 首 先 ， 我 们 导出 在 一 次 不 成 功 查 找 中 探测 的 期 望 次 数 ， 
而 这 正 是 直到 我 们 找到 一 个 空 单元 的 探测 的 期 望 次 数 。 由 于 空 单元 所 占 的 份额 为 1 一 *， 因 
此 我 们 预计 要 探测 的 单元 数 是 1/(1 一 A) 。 一 次 成 功 查找 的 探测 次 数 等 于 该 特定 元 素 插 人 时 
所 需要 的 探测 次 数 。 当 一 个 元 素 被 插入 时 ， 可 以 看 成 是 一 次 不 成 功 查 找 的 结果 。 因 此 ， 我 
们 可 以 使 用 一 次 不 成 功 查 找 的 开销 来 计算 一 次 成 功 查找 的 平均 开销 。 

需要 指出 ，4 在 0 到 当前 值 之 间 变 化 ， 因 此 早期 的 插入 操作 开销 较 少 ， 从 而 降低 平均 开 
销 。 例 如 ， 在 上 面 的 表 中 ,4 二 0.5,， 访问 18 的 开销 是 在 18 被 插入 时 确定 的 ， 此 时 4 二 0.2。 —— 
由 于 18 是 插入 到 一 个 相对 空 的 表 中 ， 因 此 对 它 的 访问 应 该 比 新 近 插 入 的 元 素 ( 比 如 69) 的 访 
问 更 容易 。 我 们 可 以 通过 使 用 积分 计算 插入 时 间 平 均值 的 方法 来 估计 平均 值 ， 如 此 得 到 
vin ES, 
这 些 公 式 显 然 优 于 线性 探测 相应 的 公式 。 聚 集 不 仅 是 理论 上 的 问题 ， 而 且 实际 上 也 发 生 在 
具体 的 实现 中 。 图 5-12 把 线性 探测 的 性 能 (虚线 ) 与 对 更 随机 冲突 解决 方法 中 期 望 的 性 能 作 
了 比较 。 成 功 的 查找 用 S 标示， 不 成 功 查 找 和 插入 分 别 用 U AT pid. 
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图 5-12 ”对 线性 探测 (虚线 ) 和 随机 方法 的 装填 因子 画 出 的 探测 次 数 
(S 为 成 功 查找 ; U 为 不 成 功 查找 ; 而 1 为 插入 ) 

如 果 = 一 0.75， 那 么 上 面 的 公式 指出 在 线性 探测 中 一 次 插 和 人 预计 探测 8. 5 次 。 如 果 A= 
0. 9， 则 预计 探测 50 次 ， 这 是 不 合理 的 。 假 如 聚集 不 是 问题 ， 那 么 这 可 与 相应 装填 因子 的 4 
次 和 10 次 探测 相 比 。 从 这 些 公式 看 到 ， 如 果 超 过 一 半 的 表 被 填 满 的 话 ， 那 么 线性 探测 就 不 
是 个 好 办 法 。 然 而 ， 如 果 4 二 0. 5， 那 么 插入 操作 平均 只 需要 探测 2.5 次 ， 并 且 对 于 成 功 的 
查找 平均 只 需要 探测 1. 5 次 。 


[159] 


5.4.2 平方 探测 法 

平方 探测 是 消除 线性 探测 中 一 次 聚集 问题 的 冲突 解决 方法 。 平 方 探测 就 是 冲突 函数 为 
二 次 函数 的 探测 方法 。 流 行 的 选择 是 PG) — 8. E 5-13 显示 了 使 用 该 冲突 函数 所 得 到 的 与 
前 面 线性 探测 例子 相同 的 开放 定 址 散 列 表 。 
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图 5-13 在 每 次 插入 后 ， 利 用 平方 探测 得 到 的 开放 定 址 散 列 表 


M 49 与 89 冲突 时 ， 其 下 一 个 位 置 为 下 一 个 单元 ， 该 单元 是 空 的 ， 因 此 49 就 被 放 在 那 
里 。 此 后 ，58 在 位 置 8 处 产生 冲突 ， 其 后 相 邻 的 单元 经 探测 得 知 发 生 了 另外 的 冲突 。 下 一 
个 探测 的 单元 在 距 位 置 8 为 2 二 4 远 处 ， 这 个 单元 是 个 空 单元 。 因 此 ， 关 键 字 58 就 放 在 单 
元 2 处 。 对 于 关键 字 69， 处 理 的 过 程 也 一 样 。 

对 于 线性 探测 ， 让 元 素 几乎 填 满 散 列 表 并 不 是 个 好 主意 ， 因 为 此 时 表 的 性 能 会 降低 。 
对 于 平方 探测 情况 甚至 更 糟 : 一 旦 表 被 填 满 超过 一 半 ， 当 表 的 大 小 不 是 素数 时 甚至 在 表 被 
填 满 一 半 之 前 ， 就 不 能 保证 一 次 找到 一 个 空 单元 了 。 这 是 因为 最 多 有 一 半 的 表 可 以 用 作 解 
决 冲突 的 备 选 位 置 。 

我 们 现在 就 来 证 明 ， 如 果 表 有 一 半 是 空 的 ， 并 且 表 的 大 小 是 素数 ， 那 么 我 们 保证 总 能 
够 插入 一 个 新 的 元 素 。 

定理 5. 1 如 果 使 用 平方 探测 ， 且 表 的 大 小 是 素数 ， 那 么 当 表 至 少 有 一 半 是 空 的 时 候 ， 
总 能 够 插入 一 个 新 的 元 素 。 

证 明 : 令 表 的 大 小 TableSize 是 一 个 大 于 3 的 ( 奇 ) 素 数 。 我 们 证 明 ， 前 | Table- 
Size/2 AKAME EHR. hX) +i’ (mod TableSize) 和 有 h(X) 十 六 (mod Table- 
Size) 是 这 些 位 置 中 的 两 个 ， 其 中 0==i, j 过 | TableSize/2」。 为 推出 矛盾 ,假设 这 两 个 位 
Wa]. ij. Td 

A(X) +2? =h(X) +)’ (mod TableSize) 


j ex (mod TableSize) 
P =g" =ù (mod TableSize) 
(i—j) G+ 7) =0 (mod TableSize) 


由 于 Tablesize 是 素数 ， 因 此 ， 要 么 (i 一 7 等 于 0(mod TableSize), BAGU+)) $F 0 
(mod TableSize)。 既 然 i Wn; 是 互 异 的 ， 那么 第 一 个 选择 是 不 可 能 的 。 但 0<i, j<|Ta- 
blesize/2」]， 因 此 第 二 个 选择 也 是 不 可 能 的 。 从 而 ， 前 | TableSize/2 」] 个 备 选 位 置 是 互 
异 的 。 由 于 要 插入 的 元 素 ( 若 无 任何 冲突 发 生 ) 也 可 以 放 到 经 散 列 得 到 的 单元 ， 因 此 任何 元 


素 都 有 [| TableSize/2 1] 个 可 能 的 位 置 。 如 果 最 多 有 | Tablesize/2 个 位 置 可 以 使 用 ， 那 
么 空 单元 总 能 够 找到 。 

哪怕 表 有 上 比 一 半 多 一 个 的 位 置 被 填 满 ， 那 么 插入 都 有 可 能 失败 (虽然 这 是 非常 难以 见 到 
的 )。 把 它 记 住 很 重要 。 另 外 ， 表 的 大 小 是 素数 也 非常 重要 ” 。 如 果 表 的 大 小 不 是 素数 ， 则 
备 选 单元 的 个 数 可 能 会 锐 减 。 例 如 ， 若 表 的 大 小 是 16， 那 么 备 选 单元 只 能 在 距 散 列 值 1、4 
或 9 距离 处 。 

在 开放 定 址 散 列 表 中 ， 标 准 的 删除 操作 不 能 施行 ， 因 为 相应 的 单元 可 能 已 经 引起 过 冲 
突 ， 元 素 绕 过 它 存 在 了 别处 。 例 如 ， 如 果 我 们 删除 89， 那 么 实际 上 所 有 其 他 的 Pind 例 程 
都 将 不 能 正确 运行 。 因 此 ， 开 放 定 址 散 列 表 需 要 懒惰 删除 ， 虽 然 在 这 种 情况 下 并 不 存在 真 
正 意义 上 的 懒惰 。 

实现 开放 定 址 散 列 方法 所 需要 的 类 型 声明 在 图 5-14 中 表示 。 这 里 ， 我 们 不 用 链表 数组 ， 而 
是 使 用 散 列表 项 单元 的 数组 ， 与 在 分 离 链 接 散 列 中 一 样 ， 这 些 单元 也 是 动态 分 配 地 址 的 。 该 表 的 
初始 化 (图 5-15) 由 分 配 空间 (第 1 一 10 行 ) 及 其 后 将 每 个 单元 的 Info 域 设置 为 Empty 组 成 。 





#ifndef _HashQuad_H 


typedef unsigned int Index; 
typedef Index Position; 


struct HashTbl; 
typedef struct HashTb] *HashTable; 


HashTable InitializeTable( int TableSize ); 

void DestroyTable( HashTable H ); 

Position Find( ElementType Key, HashTable H ); 

void Insert( ElementType Key, HashTable H ); 
ElementType Retrieve( Position P, HashTable H ); 
HashTable Rehash( HashTable H ); 

/* Routines such as Delete and MakeEmpty are omitted */ 


#endif /* _HashQuad_H */ 


/* Place in the implementation file */ 
enum KindOfEntry { Legitimate, Empty, Deleted }; 


struct HashEntry 


ElementType Element; 
enum KindOfEntry Info; 
h 


typedef struct HashEntry Cell; 


/* Cell *TheCells will be an array of */ 
/* HashEntry cells, allocated later */ 
struct HashTbl 
{ 

int TableSize; 

Cell *TheCells; 











图 5-14 开放 定 址 散 列 表 的 类 型 声明 





加 如果 表 的 大 小 是 形 如 4k 十 3 的 素数 ， 且 使 用 的 平方 冲突 解决 方法 为 FOD — i, 那么 整个 表 均 可 被 探测 到 。 
其 代价 则 是 例 程 要 略微 复杂 。 
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/* 


/* 
/* 
/* 





* 1*/ 


25 
3*/ 


4*/ 
5*/ 


6*/ 


7*7 


8*/ 
9*/ 


10*/ 


AAL 
E127 


/ 51357 


HashTable 
InitializeTable( int TableSize ) 


{ 


HashTable H; 
int 1; 


ifC TableSize « MinTableSize ) 

1 
Error( "Table size too small" ); 
return NULL; 


— 


* Allocate table */ 
= malloc( sizeof( struct HashTbl ) ); 
fC H == NULL ) 

FatalError( "Out of space!!!" ); 


/ 
H 
i 


H-»TableSize - NextPrime( TableSize ); 


/* Allocate array of Cells */ 
H->TheCells = malloc( sizeof( Cell ) * H-»TableSize ); 
if( H-»TheCells == NULL ) 

FatalError( "Out of space!!!" ); 


for( i = 0; i « H->TableSize; i++ ) 
H-»TheCells[ i ].Info = Empty; 


return H; 





如 同 分 离 链 接 散 列 法 一 样 ，Find(Key， H) RII Key 在 散 列 表 中 的 位 置 。 如 果 Key 
不 出 现 ， 那么 Find 将 返回 最 后 的 单元 。 该 单元 就 是 当 需 要 时 ，Key 将 被 插入 的 地 方 。 此 
外 ， 因 为 被 标记 了 Empty, MARI Fina 失败 很 容易 。 为 了 方便 起 见 ， 我 们 假设 散 列 表 
的 大 小 至 少 为 表 中 元 素 个 数 的 两 倍 ， 因 此 平方 探测 方法 总 能 够 实现 。 否 则 ， 我们 就 要 在 第 4 
行 前 测试 i(collisionNum)。 在 图 5-16 的 实现 中 ,标记 为 删除 的 那些 元 素 被 认为 还 在 表 


5-15 ”初始 化 开放 定 址 散 列表 的 例 程 


内 。 这 可 能 引起 一 些 问题 ， 因 为 该 表 可 能 提前 过 满 。 我 们 现在 就 来 讨论 它 。 








Ea 
/* 2% 
/* 3 


Js as) 
/* 5*/ 
/* 6*/ 


/* 


N 
% 
SS 


Position 
Find( ElementType Key, HashTable H ) 
{ 

Position CurrentPos; 

int CollisionNum; 


CollisionNum = 0; 
CurrentPos = Hash( Key, H->TableSize ); 
whileC H->TheCells[ CurrentPos ].Info != Empty && 
H-»TheCells[ CurrentPos ].Element != Key ) 
/* Probably need strcmp!! */ 


CurrentPos += 2 * ««CollisionNum - 1; 
if( CurrentPos >= H->TableSize ) 
CurrentPos -= H->TableSize; 
} 


return CurrentPos ; 





第 4 一 6 行为 进行 平方 探测 的 快速 方法 。 由 平方 解决 函数 的 定义 可 知 ，F (2) 三 


5-16 使 用 平方 探测 散 列 法 的 Find 例 程 








FG 一 1) 十 2 一 1， 因 此 ， 下 一 个 要 探测 的 单元 可 以 用 乘 以 2( 实 际 上 就 是 进行 一 位 二 进 制 移 
位 ) 并 减 1 来 确定 。 如 果 新 的 定位 越过 数组 ， 那 么 可 以 通过 减 去 Tablesize 把 它 拉 回 到 数 
组 范围 内 。 这 上 比 通常 的 方法 要 快 ， 因 为 它 避 免 了 看 似 需 要 的 乘法 和 除法 。 注 意 一 条 重要 的 
和 警告: 第 3 行 的 测试 顺序 很 重要 ， 切 勿 改变 它 ! 





最 后 的 例 程 是 插入 。 正 如 分 离 链接 散 


列 方法 那样 ， 若 Key 已 经 存在 ， 则 我 们 就 Insert( ElementType Key, HashTable H ) 
{ 


什么 也 不 做 。 其 他 工作 只 是 简单 的 修改 。 Position Pos; 

否则 ,我 们 就 把 要 插入 的 元 素 放 在 Find Pos = Find( Key, H ); 

例 程 指出 的 地 方 ， 如 图 5-17 BUR. b H-»TheCells[ Pos ].Info != Legitimate ) 
虽然 平方 探测 排除 了 一 次 聚集 ， 但 是 OE oa Ti a DD 

散 列 到 同一 位 置 上 的 那些 元 素 将 探测 相同 hiiia DO spase pes MA 





的 备 选 单元 。 这 叫 作 三 次 聚集 (secondary } } 








clustering)。 二 次 聚集 是 理论 上 的 一 个 小 
缺憾 。 模 拟 结果 指出 ， 对 每 次 查找 ， 它 一 图 5-17 使 用 平方 探测 散 列表 的 插入 例 程 
般 要 引起 另外 的 少 于 一 半 的 探测 。 下 面 的 技术 将 会 排除 这 个 缺憾 ,不 过 这 要 花费 男 外 的 一 
些 乘 法 和 除法 形 销 。 


5.4.8 双 散 列 


我 们 将 要 考察 的 最 后 一 个 冲突 解决 方法 是 双 散 列 (double hashing)。 对 于 双 散 列 ， 一 种 
流行 的 选择 是 FC) Sie hashs(X)。 这 个 公式 是 说 ,我们 将 第 二 个 散 列 孔 数 应 用 到 X 并 在 
距离 nashs(X)，2hashs(X) 等 处 探测 。hnash; (XX) 选 择 得 不 好 将 会 是 灾难 性 的 。 例 如 ， 若 
把 99 插入 到 前 面 例子 的 输入 中 ， 则 通常 的 选择 hash, (X)=X mod 9 将 不 起 作用 。 因 此 ， 

a 定 不 要 算得 0 值 。 另 外 ， 保 证 所 有 的 单元 都 能 被 探测 到 (在 下 面 的 例子 中 这 是 不 可 能 

， 因 为 表 的 大 小 不 是 素数 ) 也 是 很 重要 的 。 诸 如 hash, CX) — R— OX. mod RO ix FE Hy Phi BORE 
良好 的 作用 ， 其 中 尺 为 小 于 Tablesize 的 素数 。 如 果 我 们 选择 R—7. 图 5-18 则 显示 
插入 与 前 面相 同 的 关键 字 的 结果 。 

第 一 个 冲突 发 生 在 插入 49 E. hash: (49)= 二 7 一 0 二 7， 故 49 被 插入 到 位 置 6。 
hashz(58) 王 7 一 2 天 5， 于 是 58 被 插入 到 位 置 3。 最 后 ，69 产生 冲突 ， 从 而 被 插入 到 距离 为 
hash, (69)=7—6=1 的 地 方 。 如 果 我 们 试图 将 60 插入 到 位 置 0 处 ,那么 就 会 产生 一 个 冲 
RX. HF hashz(60) 王 7 一 4 二 3， 因 此 我 们 尝试 位 置 3、6、9， 然 后 是 2， 直 到 找 出 一 个 空 
的 单元 。 一 般 是 有 可 能 发 现 某 个 坏 情形 的 ， 不 过 这 里 没有 太 多 这 样 的 情形 。 

前 面 已 经 提 到 ， 上 面 的 散 列 表 实 例 的 大 小 不 是 素数 。 我 们 这 么 做 是 为 了 计算 散 列 了 清 数 
时 方便 ， 但 是 ， 有 必要 了 解 在 使 用 双 散 列 时 为 什么 保证 表 的 大 小 为 素数 是 重要 的 。 如 果 想 
要 把 23 插 和 人 到 表 中 ,那么 它 就 会 与 58 发 生 冲 突 。 由 于 hash,(23)=7—2=5, HARK) 
是 10， 因 此 我 们 只 有 一 个 备 选 位 置 ， 而 这 个 位 置 已 经 使 用 了 。 因 此 ， 如 果 表 的 大 小 不 是 素 
数 ， 那 么 备 选单 元 就 有 可 能 提前 用 完 。 然 而 ， 如 果 双 散 列 正确 实现 ， 则 模拟 表明 ， 预 期 的 
探测 次 数 几 乎 和 随机 冲突 解决 方法 的 情形 相同 。 这 使 得 双 散 列 理论 上 很 有 吸引 力 。 不 过 
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平方 探测 不 需要 使 用 第 二 个 散 列 函数 ， 从 而 在 实践 中 可 能 更 简单 并 且 更 快 。 









































空 表 插入 89 | 插入 18 | 插入 4 | 插入 58 | 插入 69 

0 69 
1 
2 
3 58 58 

t t 
4 
; | 
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6 | 49 49 49 
7 

| | Ji 
8 18 18 18 18 
9 89 89 89 89 89 






































图 5-18 使 用 双 散 列 方法 的 开放 定 址 散 列 表 


5.5 gnam) 


对 于 使 用 平方 探测 的 开放 定 址 散 列 法 ， 如 果 表 的 元 素 填 得 太 满 ， 那 么 操作 的 运行 时 

165| 间 将 开始 消耗 过 长 ， 且 Insert 操作 可 能 失败 。 这 可 能 发 生 在 有 太 多 的 移动 和 插入 混合 

的 场合 。 此 时 ， 一 种 解决 方法 是 建立 另外 一 个 大 约 两 倍 大 的 表 ( 而 且 使 用 一 个 相关 的 新 散 

列 函 数 ) ， 扫 描 整 个 原始 散 列 表 ， 计 算 每 个 (未 删除 的 ) 元 素 的 新 散 列 值 并 将 其 插入 到 新 
An. 

例如 ， 设 将 元 素 13、15、24 和 6 插入 到 大 小 为 7 的 开放 定 址 散 列表 中 。 散 列 函 数 是 
hCX) — X mod 7。 假 设 使 用 线性 探测 方法 解决 冲突 问题 。 插 入 结果 得 到 的 散 列表 如 图 5-19 
所 示 。 

如 果 将 23 插入 表 中 ， 那么 图 5-20 中 搬入 后 的 表 将 有 超过 70% 的 单元 是 满 的 。 因 为 表 
填 得 过 满 ， 所 以 我 们 建立 一 个 新 的 表 。 该 表 大 小 之 所 以 为 17， 是 因为 17 是 原 表 大 小 两 倍 后 
的 第 一 个 素数 。 新 的 散 列 函 数 为 h(X) 二 XX mod 17。 扫 描 原 来 的 表 ， 并 将 元 素 6、15、23、 
24 以 及 13 插入 到 新 表 中 。 最 后 得 到 的 表 见 图 5-21. 






























































0 0 6 
1 15 1 15 
2 2 23 
3 24 3 24 
4 | 4 

5 5 

6 13 6 13 

Bd 5-19 使 用 线性 探测 插入 13, 15, 图 5-20 ”使 用 线性 探测 插入 23 后 

6，24 的 开放 定 址 散 列 表 的 开放 定 址 散 列 表 
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整个 操作 就 叫 作 再 散 列 (rehashing)。 显 然 这 是 一 种 非常 昂贵 的 操作 ， 其 运行 时 间 为 
ON). AAE NN 个 元 素 要 再 散 列 而 表 的 大 小 约 为 2N， 不 过 ， 由 于 不 是 经 常 发 生 ， 因 此 实 
际 效果 根本 没有 这 么 差 。 特 别 是 ， 在 最 后 的 再 散 列 之 前 必然 ay 
已 经 存在 N/2 次 Insert， 当 然 添加 到 每 个 插入 上 的 花费 基 
本 上 是 一 个 常数 开销 ” 。 如 果 这 种 数据 结构 是 程序 的 一 部 分 ， 
那么 其 效果 是 不 显著 的 。 另 一 方面 ， 如 果 再 散 列 作为 交互 系 
统 的 一 部 分 运行 ,那么 其 插入 引起 再 散 列 的 不 幸 的 用 户 将 会 
感到 速度 减 慢 。 
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6 

再 散 列 可 以 用 平方 探测 以 多 种 方法 实现 。 一 种 做 法 是 只 要 T 
表 填 满 一 半 就 再 散 列 。 另 一 种 极端 的 方法 是 只 有 当 择 入 失败 时 24 
才 再 散 列 。 第 三 种 方法 是 途中 (middle-of-the-road) 策 略 : 24 X 
到 达 革 一 个 装填 因子 时 进行 再 散 列 。 由 于 随 着 装填 因子 的 增 E 
加 ， 表 的 性 能 的 确 有 下 降 ， 因 此 ， 以 好 的 截止 手段 实现 的 第 三 。 ， 1 
种 策略 ， 可 能 是 最 好 的 策略 。 n T 

再 散 列 使 程序 员 再 也 不 用 担心 表 的 大 小 ， 这 一 点 很 重要 ， 14 
因为 在 复杂 的 程序 中 散 列 表 不 能 够 做 得 任意 大 。 后 面 的 练习 5 15 








让 你 考察 再 散 列 与 懒惰 删除 联合 使 用 的 情况 。 再 散 列 还 可 以 ” 7^ 
用 在 其 他 的 数据 结构 中 。 例 如 ， 如 果 第 3 章 队 列 数据 结构 变 5-21 在 再 散 列 之 后 的 开放 
满 时 ， 那 么 我 们 可 以 声明 一 个 双 倍 大 小 的 数组 ， 并 将 每 一 个 定 址 散 列表 
成 员 拷贝 过 来 ， 同 时 释放 原来 的 队列 。 

如 图 5-22 所 示 ， 再 散 列 的 实现 很 简单 。 








HashTable 
Rehash( HashTable H ) 
{ 
int i, OldSize; 
Cell *OldCells; 


A 1*7 OldCells = H->TheCells; 
pg aJ OldSize = H->TableSize; 
/* Get a new, empty table */ 
gc", H = InitializeTable( 2 * OldSize ); 
/* Scan through old table, reinserting into new */ 
f* 4*/ for( i = 0; i < OldSize; i++ ) 
JE 587 ifC OldCells[ i ].Info == Legitimate ) 
/* 6*7 Insert( OldCells[ i ].Element, H ); 
eo 7% free( OldCells ); 
LY BF return H; 











图 5-22 ”对 开放 定 址 散 列 表 的 再 散 列 





C) ”这 就 是 为 什么 新 表 要 做 成 老 表 两 倍 大 的 原因 。 
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5.6 可 扩散 列 


本 章 最 后 的 论题 处 理 数据 量 太 大 以 至 于 装 不 进 主 存 的 情况 。 正 如 我 们 在 第 4 章 看 到 的 ， 
此 时 主要 考虑 的 是 检索 数据 所 需 的 磁盘 存 取 次 数 。 

与 前 面 一 样 ， 我 们 假设 在 任意 时 刻 都 有 ON 个 记录 要 存储 ，N 的 值 随时 间 而 变化 。 此 
外 ， 最 多 可 把 M 个 记录 放 入 一 个 磁盘 区 块 。 本 节 将 设 M 王 4。 

如 果 使 用 开放 定 址 散 列 法 或 分 离 链 接 散 列 法 ， 那么 主要 的 问题 在 于 ， 在 一 次 Find 操 
作 期 间 ， 冲 突 可 能 引起 多 个 区 块 被 考察 ， 甚 至 对 于 理想 分 布 的 散 列 表 也 在 所 难免 。 不 仅 如 
此 ， 当 表 变 得 过 满 的 时 候 ， 必 须 执行 代价 巨大 的 再 散 列 这 一 步 ， 它 需要 O(N) 次 磁盘 访问 。 

一 种 聪明 的 选择 叫 作 可 扩散 列 (extendible hashing)， 它 允许 用 两 次 磁盘 访问 执行 一 
Find。 插 入 操作 也 需要 很 少 的 磁盘 访问 。 

回忆 第 4 章 ，B 树 具有 深度 O(logw; N)。 随 着 M 的 增加 ，B 树 的 深度 降低 。 理 论 上 我 

们 可 以 选择 使 得 BB 树 的 深度 为 1 的 M. i 在 第 一 次 以 后 的 任何 Fina 都 将 花费 一 次 磁 
盘 访问 ， 因 为 据 推 测 根 节点 可 能 存在 主 存 中 。 ee iP Rie len 
tor) 太 高 ， 以 至 于 为 了 确定 数据 在 哪 片 树叶 上 要 进行 大 量 的 处 理工 作 。 如 果 运 行 这 一 步 的 时 
间 可 以 减 缩 ， 那 么 我 们 就 将 有 一 个 实际 的 方案 。 这 正 是 可 扩散 列 使 用 的 策略 。 

现在 假设 我 们 的 数据 由 几 个 6 位 整数 组 成 。 图 5-23 显示 这 些 数据 的 可 扩散 列 格式 。 
“ 树 ” 的 根 含 有 4 个 指针 ， 它 们 由 这 些 数据 的 前 两 位 确定 。 每 片 树叶 有 最 多 M=4 个 元 素 。 
磁 巧 这 里 每 片 树叶 中 数据 的 前 两 位 都 是 相同 的 ， 这 由 圆 括号 内 的 数 指出 。 为 了 更 正式 ， 用 
D 代表 根 所 使 用 的 位 数 ， 有 时 称 其 为 目录 (directory)。 于 是 ， 目 录 中 的 项 数 为 2?。di AM 
叶 工 所 有 元 素 共有 的 最 高 位 的 位 数 。d 将 依赖 于 特定 的 树叶 ， 因 此 d, D. 

设 欲 插入 关键 字 100100。 它 将 进入 第 三 片 树叶 ， 但 是 第 三 片 树叶 已 经 满 了 ， 没 有 空间 
存放 它 。 因 此 我 们 将 这 片 树叶 分 裂 成 两 片 树 叶 ， 它 们 由 前 三 位 确定 。 这 需要 将 目录 的 大 小 
增加 到 3。 这 些 变化 如 图 5-24 所 示 。 





图 5-23 可 扩散 列 : 原始 数据 图 5-24 可 扩散 列 : 在 100100 插入 及 目录 分 有 裂 后 


注意 ， 所 有 未 被 分 型 的 树叶 现在 各 由 两 个 相 邻 目录 项 所 指 。 因 此 ， 虽 然 重 写 整个 目录 ， 
但 是 其 他 树叶 都 没有 被 实际 访问 。 


如 果 现 在 插入 关键 字 000000， 那 么 第 一 片 树叶 就 要 被 分 裂 ， 生 成 d = 3 的 两 片 树叶 。 由 
F D=3， 故 在 目录 中 所 做 的 唯一 变化 
NG QUE Rd. EXCHEQESEESEXER 
这 个 非常 简单 的 方法 提供 了 对 大 
型 数据 库 Insert 操作 和 Fina 操作 的 
快速 存 取 时 间 。 这 里 ， 还 有 一 些 重要 
细节 我 们 尚未 考虑 。 
首先 ， 有 可 能 当 一 片 树 叶 的 元 素 
有 多 于 D 十 1 个 前 导 位 相同 时 需要 多 个 
目录 分 裂 。 例 如 ， 从 原先 的 例子 开始 ， 
D 二 2， 如 果 插 入 111010、111011， 并 图 5-25 可 扩散 列 : 在 000000 插入 及 树叶 分 裂 后 
在 最 后 插入 111100， 那 么 目录 大 小 必 
须 增加 到 4 以 区 分 五 个 关键 字 。 这 是 一 个 容易 考虑 到 的 细节 ， 但 是 千 万 不 要 忘记 它 。 其 次 ， 
存在 重复 关键 字 (duplicate key) 的 可 能 性 ; 若 存在 多 于 M 个 重复 关键 字 ， 则 该 算法 根本 无 
效 。 此 时 ， 需 要 做 出 某 些 其 他 的 安排 。 
这 些 可 能 性 指出 ， 这 些 位 完全 随机 是 相当 重要 的 ， 这 可 以 通过 把 关键 字 散 列 到 合理 长 
big otic 
， 我 们 介绍 可 扩散 列 的 某 些 性 能 ， 这 些 性 能 是 经 过 非常 困难 的 分 析 后 得 到 的 。 这 
mI 位 模式 (bit pattern) t LY 5] 43 fi ff o 
Py nr a 83 ER 3C CN /MD log, e. KE, 平均 树叶 满 的 程度 为 In 2—0. 69, XA B 树 是 
一 样 的 ， 其 实 这 完全 不 奇怪 ， 因 为 对 于 两 种 数据 结构 ， 当 添加 第 CM 十 1) 项 时 ， 一些 新 的 节 
点 就 建立 起 来 了 。 
更 惊奇 的 结果 是 ， 目 录 的 期 望 大 小 ( 换 句 话说 即 2^5» gy OCN 1" /MD., Wl M R^. JE 
么 目录 可 能 过 大 。 在 这 种 情况 下 ， 我 们 可 以 让 树叶 包含 指向 记录 的 指针 而 不 是 实际 的 记录 ， 
这 样 可 以 增加 M 的 值 。 为 了 维持 更 小 的 目录 ， 可 以 为 每 个 Fing 操作 添加 第 二 个 磁盘 访问 。 
如 果 目 录 太 大 装 不 进 主 存 ， 那 么 第 二 个 磁盘 访问 怎么 说 也 还 是 需要 的 。 





001000 | | 010100 | | 100000 


011000 | | 100100 





8 a4 


散 列表 可 以 用 来 以 常数 平均 时 间 实 现 Insert fl Find 操作 。 当 使 用 散 列表 时 ， 注 意 诸 

装填 因子 这 样 的 细节 是 特别 重要 的 ， 否则 时 间 界 将 不 再 有 效 。 当 关键 字 不 是 短 串 或 整数 
仔细 选择 散 列 函数 也 是 很 重要 的 。 
才 于 分 离 链接 散 列 法 ， 虽 然 装填 因子 不 大 时 性 能 并 不 明显 降低 ， 但 装填 因子 还 是 应 
接近 于 1。 对 于 开放 定 址 散 列 算法 ， 除 非 完全 不 可 避免 ,否则 装填 因子 不 应 该 超过 O. 5, 4 
果 使 用 线性 探测 ， 那 么 随 着 装填 因子 接近 于 1 性 能 将 急速 下 降 。 再 散 列 运算 可 以 通过 使 表 
增长 (或 收缩 ) 来 实现 ， 这 样 将 会 保持 合理 的 装填 因子 。 对 于 空间 紧缺 并 且 不 可 能 声明 巨大 
散 列表 的 情况 ， 这 是 很 重要 的 。 

二 叉 查 找 树 也 可 以 用 来 实现 Insert H Find 运算 。 虽 然 平均 时 间 界 为 O(log N), 但 
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是 二 叉 查 找 树 也 支持 那些 需要 排序 的 例 程 从 而 更 强大 。 使 用 散 列表 不 可 能 找 出 最 小 元 素 。 
除非 准确 知道 一 个 字符 串 ， 否 则 散 列 表 也 不 可 能 有 效 地 查找 它 。 二 又 查 找 树 可 以 迅速 找到 
在 一 定 范围 内 的 所 有 项 ， 散 列表 是 做 不 到 的 。 不 仅 如 此 ，O(log N) 这 个 时 间 界 也 不 比 OC) 
大 那么 多 ， 特 别 是 因为 使 用 查找 树 不 需要 乘法 和 除法 。 

另 一 方面 ， 散 列 的 最 坏 情 况 一 般 来 自 于 实现 的 缺憾 ， 而 有 序 的 输入 却 可 能 使 二 又 树 运 
行 得 很 差 。 平 衡 查 找 树 实现 的 代价 相当 高 ， 因 此 ， 如 果 不 需 要 有 序 的 信息 以 及 对 输入 是 否 
已 排序 有 怀疑 ， 那 么 就 应 该 选择 散 列 这 种 数据 结构 。 

散 列 有 着 丰富 的 应 用 。 编 译 器 使 用 散 列表 跟踪 源 代码 中 声明 的 变量 。 这 种 数据 结构 叫 
作 符 号 表 (symbol table) 。 散 列表 是 这 种 问题 的 理想 应 用 ， 因 为 只 有 Insert 和 Find 要 运 
行 。 标 识 符 一 般 都 不 长 ， 因 此 其 散 列 函 数 能 够 迅速 算出 。 

散 列 表 对 于 任何 图 论 问 题 都 是 有 用 的 ， 在 图 论 问题 中 ， 节 点 都 有 实际 的 名 字 而 不 是 数 
字 。 这 里 ， 当 读 取 输入 的 时 候 ， 顶 点 则 按照 它们 出 现 的 顺序 从 1 开始 指定 为 一 些 整数 。 再 
有 ， 输 入 很 可 能 有 一 组 依 字母 顺序 排列 的 项 。 例 如 ， 顶 点 可 以 是 计算 机 。 此 时 ， 如 果 一 个 
特定 的 计算 中 心 把 它 的 计算 机 列 为 ibml，ibm2，ibm3， 等 等 ， 那 么 ， 若 使 用 查找 树 则 在 效 
率 方面 可 能 会 有 戏剧 性 的 效果 。 

散 列表 的 第 三 种 常见 的 用 途 是 在 为 游戏 编制 的 程序 中 。 当 程序 搜索 游戏 中 不 同 的 行 时 ， 
它 跟 踪 通 过 计算 基于 位 置 的 散 列 函数 而 看 到 的 一 些 位 置 。 如 果 同 样 的 位 置 再 出 现 ， 程 序 通 
常 通过 简单 移动 变换 来 避免 昂贵 的 重复 计算 。 游 戏 程序 的 这 种 一 般 特 点 叫 作 交换 表 (trans- 
position table) 。 

散 列 的 另 一 个 用 途 是 在 线 拼 写 检验 程序 。 如 果 错 拼 检 测 ( 与 正确 性 相 比 ) 更 重要 ， 那 么 
整个 目录 可 以 被 再 散 列 ， 单 词 则 可 以 在 常数 时 间 内 完成 检测 。 散 列表 很 适合 这 项 工作 ， 
为 以 字母 顺序 排列 单词 并 不 重要 ， 而 以 它们 在 文件 中 出 现 的 顺序 显示 出 错误 拼写 当然 是 可 

我 们 回头 再 看 一 看 第 1 章 的 字谜 问题 。 如 果 使 用 第 1 章 中 描述 的 第 二 个 算法 ， 并 且 假 
设 最 大 单词 的 大 小 是 某 个 小 常数 ， 那 么 读 入 包含 W 个 单词 的 词典 并 把 它 放 入 散 列 表 的 时 间 
是 O(W)。 这 个 时 间 很 可 能 由 磁盘 1/0 而 不 是 由 那些 散 列 例 程 起 支配 作用 。 算 法 的 其 余部 
分 将 对 每 一 个 四 元 组 ( 行 ， 列 ， 方 向 ， 字 符 数 ) 测 试 一 个 单词 是 否 出 现 。 由 于 每 次 查询 时 间 
为 O(1)， 而 只 存在 常数 个 方向 (8) 和 每 个 单词 的 字符 ， 因 此 这 一 阶段 的 运行 时 间 为 
OCR * C)。 总 的 运行 时 间 是 OCR + C+W), ， 它 是 对 原始 O(R - C - W ) 的 明显 改进 。 我 们 还 
可 以 做 进一步 的 优化 ， 它 能 够 降低 实际 的 运行 时 间 。 这 些 将 在 练习 中 描述 。 





Q 练习 


5.1 Awe RIA |4371, 1323, 6173, 4199, 4344, 9679, 1989} AUB Vil PRR A(X) — X ( mod 
10) ， 指 出 结果 : 
a. 分离 链 接 散 列表 。 
b. 使 用 线性 探测 的 开放 定 址 散 列表 。 
c. 使 用 平方 探测 的 开放 定 址 散 列 表 。 





d. 第 二 散 列 函 数 为 如 (X)=7 一 (X mod 7) 的 开放 定 址 散 列表 。 

指出 将 练习 5. 1 中 的 散 列表 再 散 列 的 结果 。 

编写 一 个 程序 ， 计 算 使 用 线性 探测 、 平 方 探测 以 及 双 散 列 插入 的 长 随机 序列 所 需要 的 

冲突 次 数 。 

在 分 离 链 接 散 列表 中 进行 大 量 的 删除 可 能 造成 表 非 常 稀 玖 ,浪费 空间 。 在 这 种 情况 

下 ， 我 们 可 以 再 散 列 一 个 表 ， 大 小 为 原 表 的 一 半 。 设 当 存 在 相当 于 表 的 大 小 的 两 倍 那 

么 多 的 元 素 的 时 候 ， 我 们 再 散 列 到 一 个 更 大 的 表 。 在 再 散 列 到 一 个 更 小 的 表 之 前 ， 该 

表 应 该 有 多 人 么 稀 踊 ? 

另 一 种 冲突 解决 策略 是 定义 一 个 序列 Fai) Sr, EP r50 An, r, cc, ry 是 前 六 

个 整数 的 随机 排列 (每 个 整数 恰好 出 现 一 次 )。 

a. 证 明 ， 在 这 种 策略 下 ， 如 果 表 不 满 ， 那 么 冲突 总 能 解决 。 

b. 能 够 期 望 这 种 策略 会 消除 聚集 吗 ? 

c. 如 果 表 的 装填 因子 是 *， 执 行 一 次 插入 的 期 望 时 间 是 多 少 ? 

d. 如 果 表 的 装填 因子 是 A*， 执 行 一 次 成 功 查 找 的 期 望 时 间 是 多 少 ? 

e. 给 出 一 个 有 效 算法 (理论 上 以 及 实际 上 ) 生 成 随机 序列 。 解 释 为 什么 选择 P 的 那些 
法 则 是 重要 的 ? 

各 种 冲突 解决 方法 的 优点 和 缺点 是 什么 ? 

编写 一 个 程序 ， 实现 下 面 的 方案 ,将 大 小 分 别 为 M 和 NN E BS AP Ft Bis A9 LX (sparse 

polynomial) P, 和 P; 相 乘 。 每 个 多 项 式 代 表 一 个 链表 ， 链 表 的 各 单元 由 系数 、 窜 以 及 

Next 指针 组 成 (练习 3.7)。 我 们 用 P: 的 项 乘 以 Pi 的 每 一 项 ， 总 的 运算 次 数 为 MN, 

一 种 方案 是 将 这 些 项 排序 并 合并 同类 项 ， 但 是 ， 这 需要 排序 MN 个 记录 ， 代 价 可 能 很 

高 ， 特 别 是 在 小 内 存 环境 下 。 另 一 种 方案 是 在 计算 多 项 式 的 项 时 将 它们 合并 ， 然 后 将 

结果 排序 。 

a， 编 写 一 个 程序 实现 第 二 种 方案 。 

b. 如 果 输 出 多 项 式 大 约 有 O(M 十 NN) 项 ， 两 种 方案 的 运行 时 间 各 是 多 少 ? 

一 个 拼写 检查 程序 读 取 一 个 输入 文件 并 显示 出 所 有 在 某 个 在 线 词典 上 查 不 出 的 单词 。 

wi 30000 个 单词 ， 而 文件 很 大 ， 以 至 于 算法 只 能 对 该 输入 文件 进行 一 直 检 

oem 恋人 一 个 散 列表 ， 随 着 单词 的 读 取 而 查找 每 一 个 单 

il. 一 个 平均 单词 有 七 个 字符 并 且 能 够 将 长 度 为 L pgp ene 个 字 节 中 (因此 
ETE. 假设 有 一 个 开放 定 址 表 ， 这 需要 多 少 空间 ? 

如 果 内 存 有 限 并 且 整 个 目录 不 能 装 进 一 个 散 列 表 中 ， 那 么 mit 个 有 效 

的 算法 ， 该 算法 几乎 总 能 正常 工作 。 我 们 声明 一 个 位 (bit) 数 组 Table( 其 元 素 初始 化 

均 为 0) ， 数 组 大 小 从 0 到 Tablesize 一 1。 当 读 人 一 个 单词 时 ， 我 们 设置 Table 

[Hash(Word) J= 1。 下 列 结论 哪个 正确 ? 

a. 如 果 一 个 单词 散 列 到 一 个 值 为 0 的 位 置 ， 那 么 该 单词 不 在 词典 中 。 

b. 如 果 一 个 单词 散 列 到 一 个 值 为 1 的 位 置 ， 那 么 该 单词 在 词典 中 。 
假设 我 们 选择 TableSize- 300 007, 
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5. 


5. 12 


5. 13 


C. 


d. 


它 需 要 多 少 内 存 ? 
在 该 算法 中 出 现 一 个 错误 的 概率 是 多 少 ? 


e. 典型 的 文档 每 页 500 个 单词 ， 可 能 每 页 有 3 个 实际 拼写 错误 。 该 算法 是 否 可 用 ? 
x5.10 ”描述 一 个 避免 初始 化 散 列表 的 过 程 ( 以 内 存 消耗 作为 代价 )。 

设 欲 找 出 在 长 输入 串 AAAs PP) PeP, 的 第 一 次 出 现 。 我 们 可 以 通过 散 
IRIE (pattern string) 得 到 一 个 散 列 值 H, 并 通过 将 该 值 与 从 AiA;…A;，A;A;… 
Artis AAt Ar, ERAF) An-ti Anr An 形成 的 散 列 值 比较 来 解决 这 个 问 
题 。 如 果 我 们 得 到 散 列 值 的 一 个 匹配 ， 那 么 再 逐个 字符 地 对 串 进 行 比较 以 检验 这 个 
匹配 。 如 果 串 实际 上 确实 匹配 ， 那 么 返回 其 (在 A 中 的 ) 位 置 ， 而 在 匹配 失败 这 种 不 


大 可 能 的 情况 下 继续 进行 。 


*a. 














TERA ar A;A i; 1 …Ai+4-1 的 散 列 值 已 知 ， 那么 Aii Ai 2 AS 的 散 列 值 可 以 以 常 
数 时 间 算 出 。 





. 证 明 运 行 时 间 为 OA 十 N) 加 上 反驳 假 匹 配 所 耗费 的 时 间 。 
. 证 明 假 匹配 的 期 望 次 数 是 微不足道 的 。 
.编写 一 个 程序 实现 该 算法 。 

. 描述 一 个 算法 ， 其 最 坏 情形 的 运行 时 间 为 OHN). 

. 描述 一 个 算法 ， 其 平均 运行 时 间 为 O(N /k)。 





一 个 BASIC 程序 由 一 系列 按 递增 顺序 编号 的 语句 组 成 。 控 制 是 通过 使 用 goto 或 
gosub 后 加 一 个 语句 序号 实现 的 。 编 写 一 个 程序 读 取 合法 的 BASIC 程序 并 给 语句 重 
新 编号 ， 使 得 第 一 句 在 序号 下 处 开始 ， 并 且 每 一 个 语句 的 序号 比 前 一 语句 高 D。 你 
可 以 假设 N 条 语句 的 一 个 上 限 ， 但 是 在 输入 中 ， 语 名 序号 可 以 是 大 到 32 位 长 的 整 
数 。 你 的 程序 必须 以 线性 时 间 运 行 。 





- 利用 本 章 末 尾 描述 的 算法 实现 字谜 程序 。 
. 通过 存储 每 一 个 单词 W 以 及 W 的 所 有 前 级 ， 我 们 可 以 大 大 加 快运 行 速度 。( 如 果 


W 的 一 个 前 缀 刚好 是 词典 中 的 一 个 单词 ， 那 么 就 把 它 作 为 实际 的 单词 来 储存 。) 虽 
然 这 看 起 来 极 大 地 增加 了 散 列 表 的 大 小 ， 但 实际 上 并 不 是 ， 因 为 许多 单词 有 相同 
的 前 绥 。 当 以 某 个 特定 的 方向 执行 一 次 扫描 的 时 候 ， 如 果 被 查找 的 单词 作为 前 绥 
不 在 散 列表 中 ， 那 么 在 这 个 方向 上 的 扫描 可 以 及 早 终止 。 利 用 这 种 思想 编写 一 个 
改进 的 程序 来 解决 字谜 游戏 问题 。 














. 如 果 我 们 愿意 牺牲 散 列表 ADT 的 严肃 性 ， 那 么 可 以 在 (b) 部 分 使 程序 加 速 : 例 


如 ， 如 果 我 们 刚刚 计算 出 “excel” 的 散 列 函数 ， 那 么 就 不 必 再 从 头 开始 计算 
“excels” 的 散 列 函数 。 调 整 散 列 函数 使 得 它 能 够 利用 前 面 的 计算 。 


. 在 第 2 章 我 们 建议 使 用 对 分 查找 。 把 使 用 前 组 的 想法 结合 到 你 的 对 分 查找 算法 中 。 





修改 工作 应 该 很 简单 。 哪 个 算法 更 快 ? 


FS HHS Se Ht 10111101, 00000010, 10011011, 10111110, 01111111, 01010001, 
10010110, 00001011, 11001111, 10011110, 11011011, 00101011, 01100001, 
11110000, 01101111 插入 到 一 个 初始 为 空 的 可 扩散 列 数据 结构 中 的 结果 ， 其 中 Maa, 


5.15 ”编写 一 个 程序 实现 可 扩散 列 。 如 果 表 小 到 足 可 装 人 内 存 ， 那 么 它 的 性 能 与 分 离 链接 
和 开放 定 址 散 列 相 比 如 何 ? 
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优先 队列 〈 堆 ) 


Ey 


虽然 发 送 到 打印 机 的 作业 一 般 被 放 到 队列 中 , 但 这 未 必 总 是 最 好 的 做 法 。 例 如 ， 可 能 
有 一 项 作业 特别 重要 ， 因 此 希望 只 要 打印 机 一 有 空闲 就 来 处 理 这 项 作业 。 反 过 来 ， 若 在 打 
印 机 有 空 时 正好 有 多 项 单 页 的 作业 及 一 项 100 页 的 作业 等 待 打印 ， 则 更 合理 的 做 法 也 许 是 
最 后 处 理 长 的 作业 ， 尽 管 它 不 是 最 后 提交 上 来 的 。( 不 幸 的 是 ， 大 多 数 系统 并 不 这 么 做 ， 有 
时 可 能 特别 令 人 烦恼 。) 

类 似 地 ， 在 多 用 户 环境 中 ， 操 作 系 统 调度 程序 必须 决定 在 若干 进程 中 运行 哪个 进程 。 
一 般 只 能 允许 一 个 进程 运行 一 个 固定 的 时 间 片 。 一 种 算法 是 使 用 一 个 队列 。 开 始 时 将 作业 
放 到 队列 的 末尾 。 调 度 程序 将 反复 提取 队列 中 的 第 一 TORRE ee oan 或 者 
在 该 作业 的 时 间 片 用 完 但 未 运行 完毕 时 把 它 放 到 队列 的 末尾 。 这 种 策略 一 般 并 不 太 合适 ， 
因为 一 些 很 短 的 作业 由 于 一 味 等 待 运行 而 要 花费 很 长 的 时 间 去 处 理 。 一 般 说 来 ， 短 的 作业 
要 尽 可 能 快 地 结束 ， 这 一 点 很 重要 ， 因 此 在 已 运行 过 的 作业 当中 这 些 短 作业 应 该 拥有 优先 
权 。 此 外 ， 有 些 作 业 虽 不 短小 但 也 很 重要 ， 也 应 该 拥有 优先 权 。 

这 种 特殊 的 应 用 似乎 需要 一 类 特殊 的 队列 ， 我 们 称 之 为 优先 队列 (priority queue) 。 特 
别 地 ， 我 们 将 讨论 : 

e 优先 队列 ADT 的 有 效 实现 。 

e 优先 队列 的 使 用 。 

e 优先 队列 的 高 级 实现 。 

我 们 将 看 到 的 这 类 数据 结构 属于 计算 机 科学 中 最 讲究 的 一 


6.1 模型 


优先 队列 是 允许 至 少 下列 两 种 操作 的 数据 结构 : Insert( 插 入 )， 它 的 工作 是 显而易见 
的 ; 以 及 DeleteMin( 删 除 最 小 者 )， 它 的 工作 是 找 出 、 返 回 和 删除 优先 队列 中 最 小 的 元 
X. Insert 操作 等 价 于 EnqueueCA BO. 而 DeleteMin 则 是 队列 中 Dequeue HM) TE 
优先 队列 中 的 等 价 操 作 。DeleteMin 函数 也 变更 它 的 输入 。 软 件 工程 界 当 前 的 想法 认为 这 
不 再 是 一 个 好 的 思路 。 不 过 ， 出 于 历史 的 原因 我 们 将 继续 使 用 这 个 函数 ; 许多 程序 设计 员 
期 望 DeleteMin 以 这 种 方式 运行 。 

如 同 大 多 数 数 据 结 构 那样 ， 有 时 
可 能 要 添加 一 些 操作 ， 但 这 些 添加 的 DeleteMin (H) 优先 队列 入 
操作 属于 扩展 的 操作 ， 而 不 属于 
图 6-1 所 描述 的 基本 模型 。 

除了 操作 系统 外 ， 优 先 队 列 还 有 E TA PEE 
许多 应 用 。 在 第 7 3. RIKA BE A AI E n fap FP BE. TE REG I Cgreedy al- 
gorithm) 的 实现 方面 优先 队列 也 很 重要 ， 该 算法 通过 反复 求 出 最 小 元 来 进行 计算 ; 在 第 9 
章 和 第 10 5k. 我们 将 看 到 一 些 特殊 的 例子 。 本 章 将 介绍 优先 队列 在 离散 事件 模拟 中 的 一 个 
应 用 。 





] 
| Insert (H) 
< —= — 
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6.2 一 些 简单 的 实现 


有 几 种 明显 的 方法 实现 优先 队列 。 我 们 可 以 使 用 一 个 简单 链表 在 表 头 以 0(1) 执 行 插入 操 
作 ， 并 遍历 该 链表 以 删除 最 小 元 ， 这 又 需要 OCN) 时 间 。 另 一 种 方法 是 ， 始 终 让 表 保 持 排 序 状 
态 ; 这 使 得 插入 代价 高 昂 (OCN) ) 而 DeleteMin 花费 低廉 (O(1))。 基 于 DeleteMin 的 操作 
次 数 从 不 多 于 删除 操作 次 数 的 事实 ， 因 此 前 者 恐怕 是 更 好 的 想法 。 

还 有 一 种 实现 优先 队列 的 方法 是 使 用 二 又 查找 树 ， 它 对 这 两 种 操作 的 平均 运行 时 间 都 
是 O(log N)。 尽 管 插 入 是 随机 的 ， 而 删除 则 不 是 ， 但 这 个 结论 还 是 成 立 的 。 记 住 我 们 删除 
的 唯一 元 素 是 最 小 元 。 反 复 除 去 左 子 树 中 的 节点 似乎 损害 树 的 平衡 ， 使 得 右 子 树 加 重 。 然 
而 ， 右 子 树 是 随机 的 。 在 最 坏 的 情形 ( 即 DeleteMin 将 左 子 树 删 空 的 情形 ) 下 ， 右 子 树 拥有 
的 元 素 最 多 也 就 是 它 应 具有 的 两 倍 。 这 只 是 在 其 期 望 的 深度 上 加 了 一 个 小 常数 。 注 意 ， 通 
过 使 用 平衡 树 ， 可 以 把 界 变 成 最 坏 情 形 的 界 ， 这 将 防止 出 现 坏 的 插入 序列 。 

使 用 查找 树 可 能 有 些 过 分 ， 因 为 它 支持 许 许多 多 并 不 需要 的 操作 。 我 们 将 要 使 用 的 基 
本 的 数据 结构 不 需要 指针 ， 它 以 最 坏 情形 时 间 O(log N) 支 持 上 述 两 种 操作 。 插 入 实际 上 将 
花费 常数 平均 时 间 ， 若 无 删除 干扰 ， pad a 
队列 。 然 后 ， 我 们 将 讨论 如 何 实 现 优先 队列 以 支持 有 效 的 合并 。 这 个 附加 的 操作 似乎 有 些 
复杂 ， 它 显然 需要 使 用 指针 。 


6.3 二 又 堆 
我 们 将 要 使 用 的 这 种 工具 叫 作 二 又 堆 (binary heap)， 常 用 其 实现 优先 队列 ， 当 不 加 修 
earn 个 词 时 一 般 都 是 指 该 数据 结构 的 实现 。 在 本 节 ， 我 们 把 二 又 堆 只 叫 作 
。 同 二 又 查找 树 一 样 ， 堆 也 有 两 个 性 质 ， 即 结构 性 和 堆 序 性 。 正 如 AVL 树 一 样 ， 对 堆 的 
ia a a a ee 
时 才能 终止 。 事 实 上 这 并 不 难 做 到 。 


6. 3.1 结构 性 质 


堆 是 一 棵 被 完全 填 满 的 二 又 树 ， 有 可 能 的 om 
例外 是 在 底层 ， 底 层 上 的 元 素 从 左 到 右 填 入 。 oe 
这 样 的 树 称 为 完全 二 又 树 (complete binary ae S Yc 
tree), [8 6-2 展示 了 这 样 一 个 例子 。 F 
SAGEN. -WAA MEENA? A O E O 
到 2" 一 1 个 节点 。 这 意味 着 , 完全 二 叉 树 的 。 v VY 
高 是 Llog NJ. BREBOCog N) 的 。 i AN e 
一 项 重要 的 观察 发 现 ， 因 为 完全 二 叉 树 很 WS W/W 


有 规律 ， 所 以 它 可 以 用 一 个 数组 表示 而 不 需要 图 6-2 ”一 棵 完全 二 叉 树 
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指针 。 图 6-3 中 的 数组 对 应 图 6-2 中 的 堆 。 

对 于 数组 中 任意 位 置 i 上 的 元 素 ， 其 左 儿 子 在 位 置 2i 上 ， 右 儿子 在 左 儿 子 后 的 单元 
(2i 十 1) 中 ， 它 的 父亲 则 在 位 置 Li/2」] 上 。 因 此 ,不仅 这 里 不 需要 指针 ,而 且 遍 历 该 树 所 需 
要 的 操作 也 极其 简单 ， 在 大 部 分 计算 机 上 运行 得 很 可 能 非常 快 。 这 种 实现 方法 的 唯一 问题 
在 于 ， 最 大 的 堆 大 小 需要 事先 估计 ， 但 对 于 典型 的 情况 这 并 不 成 问题 。 在 图 6-3 rn. HER 
大 小 界限 是 13 个 元 素 。 该 数组 有 一 个 位 置 0， 后 面 将 详细 叙述 。 

[^[*[e[p[s[r [e [m [1 T1 | | 
6 1 à $ 4 Bà © Y k $ d n m i 
图 6-3 完全 二 叉 树 的 数组 实现 

















因此 ， 一 个 堆 数 据 结构 将 由 一 个 数组 (不 管 关 键 字 是 什么 类 型 )、 一 个 代表 最 大 值 的 整 
数 以 及 当前 的 堆 大 小 组 成 。 图 6-4 显示 一 个 典型 的 优先 队列 声明 。 注 意 与 图 3-47 中 栈 声明 
的 相似 性 。 图 6-4A 创建 一 个 空 堆 。 第 11 行将 在 后 面 解释 。 

本 章 将 始终 把 堆 画 成 树 ， 这 意味 着 ， 具 体 的 实现 将 使 用 简单 的 数组 。 


6.3.2 TER 

使 操作 快速 执行 的 性 质 是 堆 序 (heap order) 性 。 由 于 我 们 想 要 快速 地 找 出 最 小 元 ， 因 此 最 小 
元 应 该 在 根 上 。 如 果 我 们 将 任意 子 树 也 视 为 一 个 堆 ， 那 么 任意 节点 就 应 该 小 于 它 的 所 有 后 裔 。 

应 用 这 个 逻辑 ， 我 们 得 到 堆 序 性 质 。 在 一 个 堆 中 ， 对 于 每 一 个 节点 X. X 的 父亲 中 的 
关键 字 小 于 (或 等 于 )X 中 的 关键 字 ， 根 节点 除外 ( 它 没 有 父亲 )” 。 在 图 6-5 中 左边 的 树 是 一 


#ifndef _BinHeap_H 





struct HeapStruct; 
typedef struct HeapStruct *PriorityQueue; 


PriorityQueue Initialize( int MaxElements ); 
void Destroy( PriorityQueue H ); 

void MakeEmpty( PriorityQueue H ); 

void Insert( ElementType X, PriorityQueue H ); 
ElementType DeleteMin( PriorityQueue H ); 
ElementType FindMin( PriorityQueue H ); 

int IsEmpty( PriorityQueue H ); 

int IsFull( PriorityQueue H ); 


#endif 


/* Place in implementation file */ 
struct HeapStruct 


int Capacity; 

int Size; 

ElementType *Elements; 
h 











图 6-4 优先 队列 的 声明 





O ”类似 地 ,我们 可 以 声明 一 个 (max) 堆 ， 它 使 我 们 能 够 通过 改变 堆 序 性 质 有 效 地 找 出 和 删除 最 大 元 。 因 此 ， 优 
先 队列 可 以 用 来 找 出 最 大 元 或 最 小 元 ， 但 这 需要 提前 决定 。 
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PriorityQueue 
Initialize( int MaxElements ) 


PriorityQueue H; 


/* 1*/ if( MaxElements < MinPQSize ) 
Jt am Error( "Priority queue size is too small" ); 
f* 327 H = malloc( sizeof( struct HeapStruct ) ); 
/* 4*/ IFC H == NULL ) 
/* 5*/ FatalError( "Out of space!!!" ); 

/* Allocate the array plus one extra for sentinel */ 
/* 6*/ H->Elements = malloc( ( MaxElements + 1 ) 

* sizeof( ElementType ) ); 

/* 7*/ if( H->Elements == NULL ) 
/* 8*/ FatalError( "Out of space!!!" ); 
/* 9*/ H-»Capacity - MaxElements; 
/*10*/ H->Size = 0; 
/511*7 H->Elements[ 0 ] = MinData; 
/*12*/ return H; 











图 6-4A 优先 队列 的 声明 


个 堆 ， 但 是 ,右边 的 树 则 不 是 (虚线 表示 堆 有 性 质 被 破坏 )。 我 们 照 惯 例假 设 ,， KETER 
WM. 虽然 它们 可 能 任意 复杂 。 


oe. ® 
DA SA 
ej ne ® © HH sm 
OOD Sbd 


图 6-5 两 棵 完全 树 (只 有 左边 的 树 是 堆 ) 
根据 堆 序 性 质 ， 最 小 元 总 可 以 在 根 处 找到 。 因 此 ， 我 们 以 常数 时 间 完 成 附加 运算 


FindMin. 


6.3.3 基本 的 堆 操 作 


无 论 从 概念 上 还 是 实际 上 考虑 ， 执 行 这 两 种 所 要 求 的 操作 都 是 容易 的 ， 只 需要 始终 保 
持 堆 序 性 质 。 


Insert( 插 入 ) 

为 将 一 个 元 素 X 插入 到 堆 中 ,我 们 在 下 一 个 空闲 位 置 创建 一 个 空 六 ， 否则 该 堆 将 不 是 
EEP. WMR X 可 以 放 在 该 空 穴 中 而 并 不 破坏 堆 的 序 ， 那 么 插入 完成 。 和 否则 ， 我 们 把 空 穴 
的 父 节 点 上 的 元 素 移 人 该 空 灾 中 ,这样 ， 空 穴 就 朝 着 根 的 方向 上 行 一 步 。 继 续 该 过 程 直到 
X 能 被 放 入 空 穴 中 为 止 。 如 图 6-6 R, HTA 14， 我 们 在 堆 的 下 一 个 可 用 位 置 建立 一 
个 空 穴 。 由 于 将 14 插入 空 穴 破 坏 了 堆 序 性 质 ， 因 此 将 31 移 人 该 空 穴 。 在 图 6-7 中 继续 这 种 
策略 ， 直 到 找 出 置 入 14 的 正确 位 置 。 
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图 6-6 ”尝试 插入 M: 创建 一 个 空 穴 ， 再 将 空 穴 上 冒 
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[182] 图 6-7 将 14 插 入 到 前 面 的 堆 中 的 其 余 两 步 


这 种 一 般 的 策略 叫 作 上 滤 (percolate up): 新 元 素 在 堆 中 上 滤 直 到 找 出 正确 的 位 置 。 使 
用 图 6-8 所 示 的 代码 很 容易 实现 插入 。 





/* H->Element[ 0 ] is a sentinel */ 
void 
Insert( ElementType X, PriorityQueue H ) 
Tht 34 
ifC IsFull( H ) ) 
Error( "Priority queue is full" ); 


return; 


} 


for( i = ++H->Size; H->Elements[ i / 2] > X; i /= 2 ) 
H->Elements[ i ] = H->Elements[ i / 2 ]; 
H->Elements[ i ] = 











图 6-8 插入 到 一 个 二 叉 堆 的 过 程 


其 实 我 们 本 可 以 使 用 Insert 例 程 通过 反复 实施 交换 操作 直至 建立 正确 的 序 来 实现 上 
滤 过 程 ， 可 是 一 次 交换 需要 3 条 赋值 语句 。 如 果 一 个 元 素 上 滤 d 层 ， 那 么 由 于 交换 而 实施 
的 赋值 的 次 数 就 达到 3&， 而 这 里 的 方法 却 只 用 d 十 1 次 赋值 。 

如 果 要 插入 的 元 素 是 新 的 最 小 值 ， 那 么 它 将 一 直 被 推 向 顶端。 这 样 在 某 一 时 刻 ，i 将 是 
1， 我 们 就 需要 邻 程序 跳出 while 循环 。 dd i i ae ^i. 
我 们 采用 的 是 把 一 个 很 小 的 值 放 到 位 置 0 处 以 使 while 循环 得 以 终止 。 这 个 值 必须 保证 小 
于 (或 等 于 ) 堆 中 的 任何 值 ， 我 们 称 之 为 标记 (sentinel)。 ee 
用 。 通 过 添加 一 条 哑 信 息 Cdummy piece of information) ， 我 们 避免 了 每 个 循环 都 要 执行 一 
次 的 测试 ， 从 而 节省 了 一 些 时 间 。 

如 果 欲 插入 的 元 素 是 新 的 最 小 元 从 而 一 直上 滤 到 根 处 ,那么 这 种 插入 的 时 间 高 达 


O(log N) 。 平 均 看 来 ， 这 种 上 滤 终 止 得 要 早 ; 已 证 明 ， 执 行 一 次 插入 平均 需要 2.607 次 比 
较 ， 因 此 Insert 将 元 素平 均 上 移 1.607 层 。 

DeleteMin( 删 除 最 小 元 ) 

DeleteMin 以 类 似 于 插入 的 方式 处 理 。 找 出 最 小 元 是 容易 的 ， 困 难 的 部 分 是 删除 它 。 
当 删 除 一 个 最 小 元 时 ， 在 根 节点 处 产生 了 一 个 空 穴 。 由 于 现在 堆 少 了 一 个 元 素 ， 因 此 堆 中 
最 后 一 个 元 素 X 必须 移动 到 该 推 的 某 个 地 方 。 如 果 X 可 以 放 到 空 穴 中 ,那么 DeleteMin 
完成 。 不 过 这 一 般 不 太 可 能 ， 因 此 我 们 将 空 穴 的 两 个 儿子 中 较 小 者 移 人 空 穴 ， 这 样 就 把 空 
穴 向 下 推 了 一 层 。 重 复 该 步 又 直到 X 可 以 放 和 人 空 穴 。 因 此 ,我们 的 作法 是 将 X 置 入 沿 着 从 
根 开 始 包 含 最 小 儿子 的 一 条 路 径 上 的 一 个 正确 的 位 置 。 

在 图 6-9 中 左边 的 图 显示 DeleteMin 之 前 的 堆 。 删 除 13 后 ， 我 们 必须 要 正确 地 将 31 
放 到 堆 中 。31 不 能 放 在 空 闪 中 ， 因 为 这 将 破坏 堆 序 性 质 。 于 是 ,我 们 把 较 小 的 儿子 14 ELA 
空 穴 ， 同 时 空 穴 下 滑 一 层 ( 见 图 6-10)。 重 复 该 过 程 ， 把 19 置信 空 穴 ， 在 更 下 一 层 上 建立 一 
个 新 的 空 穴 。 然 后 ， 再 把 26 置 入 空 穴 ， 在 底层 又 建立 一 个 新 的 空 穴 。 最 后 ， 我 们 得 以 将 31 
BAZALA 6-11) 。 这 种 一 般 的 策略 叫 作 下 滤 (percolate down) 。 在 其 实现 例 程 中 我 们 使 
用 类 似 于 在 Insert 例 程 中 用 过 的 技巧 来 避免 进行 交换 操作 。 
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l pP E P. - E X 


S 8 (9$ d CO aod © 
* += = - )- 六 < = 
bgd "em 
65) (26) G2) 31 (65) (26) G2) 31 


Æ 6-10 4 DeleteMin 中 的 接 下 来 的 两 步 
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A 6-11 在 DeleteMin 中 的 最 后 两 步 
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在 堆 的 实现 中 经 常 发 生 的 错误 是 当 堆 中 存在 偶数 个 元 素 的 时 候 ， 此 时 将 遇 到 一 个 节点 只 
有 一 个 儿子 的 情况 。 不 要 假设 节点 总 有 两 个 儿子 ， 因 此 这 就 涉及 一 个 附加 的 测试 。 在 
Side ani dai 我 们 已 在 第 8 行进 行 了 这 种 测试 。 一 种 极其 巧妙 的 解决 方法 是 始终 保 
证 你 的 算法 把 每 一 个 节点 都 看 成 有 两 个 儿子 。 为 了 实施 这 种 解法 ， 当 堆 的 大 小 为 偶数 时 ， 在 每 
个 下 滤 开 始 时 ， SIRO rca aL NOE RI 你 必须 在 深思 熟 
虑 以 后 再 这 么 做 ， 而 且 必须 要 判断 你 是 否 确实 要 使 用 这 种 技巧 。 虽然 这 不 再 需要 测试 儿子 的 丰 
在 性 ， 但 是 你 还 是 需要 测试 何 时 到 达 底 层 ， 因 为 对 每 一 片 树叶 算法 将 需要 一 个 标记 。 





ElementType 
DeleteMin( PriorityQueue H ) 
{ 
int i, Child; 
ElementType MinElement, LastElement; 
fe 1*7 if( IsEmpty( H ) ) 
{ 
J* 2*/ Error( "Priority queue is empty" ); 
fe Bey return H->Elements[ 0 ]; 
} 
/* 4*/ MinElement = H->Elements[ 1 ]; 
/* 5*/ LastElement = H->Elements[ H->Size-- ]; 
/* OSS for( i = 1; i * 2 <= H->Size; i = Child ) 
{ 
/* Find smaller child */ 
ce 77 Child = i * 2; 
fe 857 if( Child != H->Size && H->Elements[ Child + 1 ] 
/* Bey « H->Elements[ Child ] ) 
/*10*/ Chi ld++; 
/* Percolate one level */ 
/*11*/ if( LastElement > H->Elements[ Child ] ) 
/*12*/ H->Elements[ i ] = H->Elements[ Child ]; 
else 
/*13*/ break; 
/*14*/ H->Elements[ i ] = LastElement; 
a return MinElement; 











图 6-12 在 二 叉 堆 中 执行 DeleteMin 的 函数 


这 种 算法 的 最 坏 情形 运行 时 间 为 O(log N)。 平 均 而 言 ， 放 在 根 处 的 元 素 几 乎 下 滤 到 堆 
的 底层 ( 它 所 来 自 的 那 层 ) ， 因 此 平均 运行 时 间 为 O(log ND. 


6.3.4 ”其 他 的 堆 操 作 


注意 ， 虽 然 求 最 小 值 操作 可 以 在 常数 时 间 完 成 ， 但是， 按照 求 最 小 元 设计 的 堆 ( 也 称 作 
最 小 值 (min) 堆 ) 在 求 最 大 元 方面 却 无 任何 帮助 。 事 实 上 ， 一 个 堆 所 蕴含 的 关于 序 的 信息 很 
少 ， 因 此 ， 若 不 对 整个 堆 进行 线性 搜索 ， 是 没有 办 法 找 出 任何 特定 的 关键 字 的 。 为 说 明 这 
一 点 ， 考 虑 图 6-13 所 示 的 大 型 堆 结构 (具体 元 素 没有 标 出 )， 我 们 看 到 ， 关 于 最 大 值 的 元 素 
所 知道 的 唯一 信息 是 该 元 素 在 树叶 上 。 但是， 半数 的 元 素 位 于 树叶 上 ， 因 此 该 信息 是 没 什 
么 用 的 。 由 于 这 个 原因 ， 如 果 重 要 的 是 要 知道 元 素 都 在 什么 地 方 ， 那 么 除 堆 之 外 ， 还 必须 
用 到 诸如 散 列 表 等 某 些 其 他 的 数据 结构 。( 回 忆 : 该 模型 并 不 允许 查看 堆 内 部 。) 
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图 6-13 一 棵 巨大 的 完全 二 又 树 


如 果 我 们 假设 通过 某 种 其 他 方法 得 知 每 一 个 元 素 的 位 置 ， 那 么 有 几 种 其 他 操作 的 开销 
将 变 小 。 下 述 三 种 这 样 的 操作 均 以 对 数 最 坏 情 形 时 间 运 行 。 

DecreaseKey( 降 低 关 键 字 的 值 ) 

DecreaseKey(P,. A. 电 ) 操 作 降 低 在 位 置 已 处 的 关键 字 的 值 ， 降 值 的 幅度 为 正 的 量 
4A。 由 于 这 可 能 破坏 堆 的 序 ， 因 此 必须 通过 上 滤 对 堆 进行 调整 。 该 操作 对 系统 管理 程序 是 有 
用 的 : 系统 管理 程序 能 够 使 它们 的 程序 以 最 高 的 优先 级 运行 。 

IncreaseKey( 增 加 关键 字 的 值 ) 

IncreaseKey(P, A. 也 ) 操 作 增 加 在 位 置 P 处 的 关键 字 的 值 ， 增 值 的 幅度 为 正 的 量 
A。 这 可 以 用 下 滤 来 完成 。 许 多 调度 程序 自动 地 降低 正在 过 多 地 消耗 CPU 时 间 的 进程 的 优 
先 级 。 

Delete( 删 除 ) 

Delete(P, HRE MIRE P [HE 已 上 的 节点 。 这 通过 首先 执行 DecreaseKey( 卫 ， 
co, H), FEAT DeleteMin( 肪 ) 来 完成 。 当 一 个 进程 被 用 户 中 止 ( 而 不 是 正常 终止 ) 时 ， 
它 必须 从 优先 队列 中 除去 。 

BuildHeap (构建 堆 ) 

BuildHeap( HREH N 个 关键 字 作为 输入 并 把 它们 放 入 空 堆 中 。 显 然 ， 这 可 以 使 
用 六 个 相继 的 Insexrt( 插 人) 操作 来 完成 。 由 于 每 个 Insert 将 花费 O(1) 平 均 时 间 以 及 
O(log N) 的 最 坏 情 形 时 间 ， 因 此 该 算法 的 总 运行 时 间 则 是 O(N) 平 均 时 间 而 不 是 
O(N log NN) 最 坏 情形 时 间 。 由 于 这 是 一 种 特殊 的 指令 ,没有 其 他 操作 干扰 ， 而 且 我 们 已 
经 知道 该 指令 能 够 以 线性 平均 时 间 实 施 ， 因 此 ， 期望 能 够 保证 线性 时 间 界 的 考虑 是 合乎 
情理 的 。 

一 般 的 算法 是 将 N 个 关键 字 以 任意 顺序 放 入 树 中 ， 
保持 结构 特性 。 此 时 ， 如 果 percolateDown(G) 从 节点 ene 


i FE, 那么 执行 图 6-14 中 的 该 算法 创建 一 棵 具有 堆 序 
的 树 Cheap-ordered tree) 。 图 6-14  BuildHeap 的 简要 代码 














147 


148 数据 结构 与 算法 分 析 C 语言 描述 


图 6-15 中 的 第 一 棵 树 是 无 序 树 。 从 图 6-15 到 图 6-18 中 其 余 七 棵 树 展示 了 七 次 Perco- 
lateDown 的 执行 结果 。 每 条 虚线 对 应 两 次 比较 : 一 次 是 找 出 较 小 的 儿子 节点 ， 男 一 次 是 
将 较 小 的 儿子 与 该 节点 比较 。 注 意 ， 在 整个 算法 中 只 有 10 条 虚线 (可 能 已 经 存在 第 11 
条 一 一 在 哪里 )， 对 应 20 次 比较 。 
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Æ 6-17 A: # PercolateDown(4)Z m; 4: 在 PercolateDown(3) 之 后 
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图 6-18 Zr: 在 PercolateDown(2) 之 后 ; 4: 在 PercolateDown(1) 之 后 


为 了 确定 BuildHeap 的 运行 时 间 的 界 ， 我 们 必须 确定 虚线 的 条 数 的 界 。 这 可 以 通过 计 
算 堆 中 所 有 节点 的 高 度 的 和 得 到 ， 它 是 虚线 的 最 大 条 数 。 现 在 我 们 想 要 说 明 的 是 : 该 和 为 O(N)。 
定理 6.1 a 2"'—-1 个 节点 、 高 为 及 的 理想 二 又 树 (perfect binary tree) 的 节点 的 高 


[187| 度 的 和 为 2.+! 一 1 一 (十 1)。 


a 证 明 : 容易 看 出 ， 该 树 由 高 度 h 上 的 1 个 节点 、 高 度 h 一 1 上 的 2 个 节点 、 高 度 h 一 2 
”上 的 2 个 节点 以 及 一 般 地 在 高 度 h 一 i 上 的 2 个 节点 组 成 。 则 所 有 节点 的 高 度 的 和 为 
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h 
S= 2h—i) 
二 有 十 2(h 一 1) 十 4(h 一 2) 十 8(h 一 3) 十 16(h 一 4) 十 … 十 2"!(1) (6. 1) 
PY 13€ VA 2 得 到 方程 
2S = 2h+4(h—1) --8(h — 2) + 16(h—3) + +201) (6. 2) 


将 这 两 个 方程 相 减 得 到 式 (6. 3)。 我 们 发 现 ， 非 常数 项 差不多 都 消去 了 ,例如 ，2h 一 2(h 一 1) 二 2， 
4(h 一 1) 一 4(h 一 2) 二 4， 等 等 。 式 (6.2) 的 最 后 一 项 六 在 式 (6.1) 中 不 出 现 ， 因 此 ， 它 出 现在 
式 (6.3) 中 。 式 (6.1) 中 的 第 一 项 hh 在 式 (6.2) 中 不 出 现 ， 因此， 一 hh 出 现在 式 (6. 3) 中 。 我 们 得 到 
S= 一 有 十 2 十 4 十 8 十 十 2 所 十 2 二 (21 一 1) 一 (hh 十 1) (6.3) 

这 就 证 明了 该 定理 。 

完全 树 (complete tree) 不 是 理想 二 叉 树 (perfectly binary tree), ， 但 是 我 们 得 到 的 结果 却 
是 一 棵 完全 树 的 节点 高 度 的 和 的 上 界 。 由 于 一 棵 完全 树 节 点 数 在 2 和 2 一 之 间 ， 因 此 该 定 
理 意味 着 这 个 和 是 O(N)， 其 中 六 是 节点 的 个 数 。 

虽然 我 们 得 到 的 结果 对 证 明 Bui ldHeap 是 线性 的 而 言 是 充分 的 ,但 是 高 度 的 和 的 界 却 
并 不 固定 。 对 于 具有 N=” 个 节点 的 完全 树 ， 我 们 得 到 的 界 大 臻 是 2N。 由 归纳 法 可 以 证 
Hj. 高 度 的 和 是 N 一 bp(N)， 其 中 6b(N) 是 在 NN 的 二 进 制 表示 法 中 1 的 个 数 。 


6.4 优先 队列 的 应 用 


我 们 已 经 提 到 优先 队列 如 何 用 于 操作 系统 的 设计 中 。 在 第 9 章 ， 我 们 将 看 到 优先 队列 如 何 有 
效 地 用 于 几 个 图 论 算法 的 实现 中 。 此 处 ， 我 们 将 介绍 如 何 应 用 优先 队列 来 得 到 两 个 问题 的 解 。 


6.4.1 选择 问题 


我 们 将 要 考察 的 第 一 个 问题 是 来 自 第 1 章 的 选择 问题 。 当 时 的 输入 是 N 个 元 素 以 及 一 
个 整数 &k ， 这 N 个 元 素 的 集 可 以 是 全 序 的 。 该 选择 问题 是 要 找 出 第 个 最 大 的 元 素 。 

在 第 1 章 中 给 出 了 两 个 算法 ， 但 是 它们 都 不 是 很 高 效 的 算法 。 第 一 个 算法 称 为 1A， 是 
把 这 些 元 素 读 和 人 数组 并 将 它们 排序 ,返回 适当 的 元 素 。 假 设 使 用 的 是 简单 的 排序 算法 ， 则 
运行 时 间 为 O(N?)。 男 一 个 算法 叫 作 1B， 是 将 & 个 元 素 读 和 人 一 个 数组 并 将 其 排序 。 这 些 元 
素 中 的 最 小 者 在 第 & 个 位 置 上 。 我 们 一 个 一 个 地 处 理 其 余 的 元 素 。 当 开始 处 理 一 个 元 素 时 ， 
它 先 与 数组 中 第 & 个 元 素 比 较 ， 如 果 该 元 素 大 ,那么 将 第 & 个 元 素 除 去 ， 而 这 个 新 元 素 则 
被 放 在 其 余 & 一 1 个 元 素 间 正确 的 位 置 上 。 当 算法 结束 时 ， 第 & 个 位 置 上 的 元 素 就 是 问题 的 
解 。 该 方法 的 运行 时 间 为 O(CN.A)。( 为 什么 ?) 如 果 A=[「 N/2 1， 那 么 这 两 种 算法 都 是 
O(N ) 的 。 注 意 ， 对 于 任意 的 A， 我 们 可 以 求解 对 称 的 问题 : 找 出 第 (CN 一 &A 十 1) 个 最 小 的 元 
R. Am k= N/2 1 实际 上 是 这 两 个 算法 的 最 困难 的 情形 。 这 刚好 也 是 最 有 趣 的 情形 ， 因 为 
这 个 & 值 称 为 中 位 数 (median) 。 

我 们 在 这 里 给 出 两 个 算法 ,在 k—[ N/2 1 的 极端 情形 下 它们 均 以 O(N log N) 运 行 ， 这 
是 明显 的 改进 。 
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算法 6A 

为 了 简单 起 见 ， 假 设 我 们 只 考虑 找 出 第 个 最 小 的 元 素 。 该 算法 很 简单 。 我 们 将 N 个 
元 素 读 入 一 个 数组 。 然 后 对 该 数组 应 用 BuildHeap 算法 。 最 后 ， 执 行 & 次 DeleteMin 操 
作 。 从 该 堆 最 后 提取 的 元 素 就 是 我 们 的 答案 。 显 然 ， 通 过 改变 堆 序 性 质 ， 我 们 就 可 以 求解 
原始 的 问题 找 出 第 & 个 最 大 的 元 素 。 

这 个 算法 的 正确 性 应 该 是 显然 的 。 如 果 使 用 BuilaHeap， 构 造 堆 的 最 坏 情 形 用 时 是 
O(N)， 而 每 次 DeleteMin 用 时 O(log N)。 由 于 有 上 次 DeleteMin， 因 此 我 们 得 到 总 的 
运行 时 间 为 O(N 十 k log ND. W R=OCN/log N)， 那 么 运行 时 间 取 决 于 BuildHeap 操 
作 ， 即 OCN)。 对 于 大 的 & 值 ， 运 行 时 间 为 Ok log ND. WR &—[ N/2 1， 那 么 运行 时 间 
HON log ND, 

注意 ， 如 果 我 们 对 =N 运行 该 程序 并 在 元 素 离开 堆 时 记录 它们 的 值 ， 那 么 我 们 实际 

已 经 对 输入 文件 以 时 间 OCN log N) 作 了 排序 。 在 第 7 3€. 我 们 将 细 化 该 想法 ,得 到 一 种 
快速 的 排序 算法 ， 叫 作 堆 排序 (heapsort)。 

算法 6B 

关于 第 2 个 算法 ， 我们 回 到 原始 问题 ， 找 出 第 个 最 大 的 元 素 。 我 们 使 用 算法 1B 的 思 
路 。 在 任意 时 刻 我 们 都 将 维持 & 个 最 大 元 素 的 集合 S。 在 前 & 个 元 素 读 入 以 后 ， 当 再 读 入 一 
个 新 的 元 素 时 ， 该 元 素 将 与 第 & 个 最 大 元 素 进行 比较 ， 记 这 第 & 个 最 大 的 元 素 为 Se。 注意 ， 
S, Æ S 中 最 小 的 元 素 。 如 果 新 的 元 素 更 大 ， 那 么 用 新 元 素 代替 S 中 的 Si。 此 时 ，S 将 有 一 
个 新 的 最 小 元 素 ， 它 可 能 是 新 添加 的 元 素 ， 也 可 能 不 是 。 在 输入 终了 时 ， 我 们 找到 S 中 最 
BURNS 将 其 返回 ， 它 就 是 答案 。 

这 基本 上 与 第 1 章 中 描述 的 算法 相同 。 不 过 ， 这 里 我 们 使 用 一 个 堆 来 实现 S。 前 上 个 元 
素 通 过 调用 一 次 BuildHeap 以 总 时 间 O(k) 被 置信 堆 中 。 处 理 每 个 其 余 的 元 素 的 时 间 为 
OC (检测 元 素 是 否 进 入 S) 再 加 上 时 间 OClog k) (在 必要 时 删除 S 并 插入 新 元 素 )。 因 此 ， 
的 时 间 是 O(k 十 (N 一 k)log &) —OCN log A) 。 该 算法 也 给 出 找 出 中 位 数 的 时 间 界 CN log ND. 

在 第 7 章 ， 我 们 将 看 到 如 何以 平均 时 间 O(N) 解 决 这 个 问题 。 在 第 10 章 ， 我 们 将 看 到 
-个 以 OCN) 最 坏 情形 时 间 求 解 该 问题 的 算法 ， 虽 然 不 切实 际 但 却 很 精致 。 


6.4.2 事件 模拟 


在 3.4.3 节 我 们 描述 了 一 个 重要 的 排队 问题 。 在 那里 我 们 有 一 个 系统 (比如 银行 )， 顾 
客 们 到 达 并 站 队 等 待 直到 有 个 出 纳 员 中 有 一 个 腾 出 手 来 。 顾 客 的 到 达 情 况 由 概率 分 布 函 数 
控制 ， 服 务 时 间 ( 一 旦 出 纳 员 腾 出 时 间 后 用 于 服务 的 时 间 量 ) 也 是 如 此 。 我 们 的 兴趣 在 于 一 
位 顾客 平均 必须 要 等 多 久 或 所 排 的 队伍 可 能 有 多 长 这 类 统计 问题 。 

对 于 某 些 概率 分 布 以 及 & 的 一 些 值 ， 答案 都 可 以 精确 地 计算 出 来 。 然 而 随 着 人 变 
分 析 明 显 变 得 困难 ， 因 此 使 用 计算 机 模拟 银行 的 运作 很 有 吸引 力 。 用 这 种 方法 ， 银 行 官员 
可 以 确定 为 保证 合理 、 通 畅 的 服务 需要 多 少 出 纳 员 。 

模拟 由 处 理 中 的 事件 组 成 。 这 里 的 两 个 事件 是 : 一 位 顾客 的 到 达 ， 以 及 一 位 顾客 的 离 
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去 从 而 腾 出 一 名 出 纳 员 。 

我 们 可 以 使 用 概率 表 数 来 生成 一 个 输入 流 ， 它 由 每 位 顾客 的 到 达 时 间 和 服务 时 间 的 序 
偶 组 成 ， 并 通过 到 达 时 间 排 序 。 我 们 不 必 使 用 一 天 中 的 准确 时 间 ， 而 是 使 用 单位 时 间 量 ， 
称 之 为 一 个 滴答 (tick) 。 

进行 这 种 模拟 的 一 个 方法 是 启动 在 0 滴答 处 的 一 台 模 拟 钟表 。 我 们 让 钟表 一 次 走 一 个 
滴答 ， 同 时 查看 是 否 有 一 个 事件 发 生 。 如 果 有 ， 那 么 我 们 处 理 这 个 ( 些 ) 事 件 ， 搜 集 统 计 资 
料 。 当 没有 顾客 留 在 输入 流 中 且 所 有 的 出 纳 员 都 闲 着 的 时 候 ， 模 拟 结束 。 

这 种 模拟 策略 的 问题 是 ， 它 的 运行 时 间 不 依赖 顾客 数 或 事件 数 (每 位 顾客 有 两 个 事件 )， 
但 是 却 依赖 滴答 数 ， 而 后 者 实际 又 不 是 输入 的 一 部 分 。 为 了 看 清 为 什么 问题 在 于 此 ， 假 设 
将 钟表 的 单位 改 成 滴答 的 千 分 之 一 Cmillitick) 并 将 输入 中 的 所 有 时 间 乘 以 1000， 则 结果 将 是 
模拟 用 时 长 了 1000 倍 ! 

避免 这 种 问题 的 关键 是 在 每 一 个 阶段 让 钟表 直接 走 到 下 一 个 事件 时 间 。 从 概念 上 看 这 
是 容易 做 到 的 。 在 任意 时 刻 ， 可 能 出 现 的 下 一 事件 或 者 是 输入 文件 中 下 一 顾客 的 到 达 ， 或 
者 是 在 一 名 出 纳 员 处 一 位 顾客 离开 。 由 于 可 以 得 知 将 发 生 事件 的 所 有 时 间 ， 因 此 我 们 只 需 
找 出 最 近 的 要 发 生 的 事件 并 处 理 这 个 事件 。 

如 果 事 件 是 离开 ,那么 处 理 过 程 包括 搜集 离开 的 顾客 的 统计 资料 以 及 检验 队伍 (队列 》 
看 是 否 还 有 另外 的 顾客 在 等 待 。 如 果 有 ， 那么 我 们 加 上 这 位 顾客 ， 处 理 所 需 要 的 统计 资料 ， 
计算 该 顾客 将 要 离开 的 时 间 ， 并 将 离开 事件 加 到 等 待 发 生 的 事件 集中 。 

如 果 事 件 是 到 达 ， 那 么 我 们 检查 闲 着 的 出 纳 员 。 如 果 没 有 , 那么 我 们 把 该 到 达 事件 放 
到 队伍 (队列 ) 中 ; 否则， 我 们 分 配 顾客 一 个 出 纳 员 ， 计 算 顾 客 的 离开 时 间 ， 并 将 离开 事件 
加 到 等 待 发 生 的 事件 集中 。 

在 等 待 的 顾客 队伍 可 以 实现 为 一 个 队列 。 由 于 我 们 需要 找到 最 近 的 将 要 发 生 的 事件 ， 
合适 的 办 法 是 将 等 待 发 生 的 离开 的 集合 编 人 一 个 优先 队列 中 。 下 一 事件 是 下 一 个 到 达 或 下 
一 个 离开 (哪个 发 生 早 就 是 哪个 ) ， 它 们 都 容易 达到 。 

为 模拟 编写 例 程 很 简单 ， 但 是 可 能 很 耗费 时 间 。 如 果 有 C 个 顾客 (因此 有 2C 个 事件 ) 和 
个 出 纳 员 ， 那 么 模拟 的 运行 时 间 将 会 是 OC(C log(CR 二 1))8 ， 因 为 计算 和 处 理 每 个 事件 花费 
O(log H), Hip. H=k+1 为 堆 的 大 小 。 


6.5 d-ME 


二 叉 堆 是 如 此 简单 ， 以 至 于 它们 几乎 总 是 用 在 需要 优先 队列 的 时 候 。d- 堆 是 二 又 堆 的 
简单 推广 ， 它 恰 像 一 个 二 叉 堆 ， 只 是 所 有 的 节点 都 有 d 个 儿子 (因此 ， 二 叉 堆 是 2- 堆 )。 

图 6-19 表示 的 是 一 个 3- 堆 。 注 意 ，d- 堆 要 比 二 又 堆 浅 得 多 ， 它 将 Insert 操作 的 运行 
时 间 改 进 为 OClog, N)。 人 然而， 对 于 大 的 4，DeleteMin 操作 费时 得 多 ， 因 为 虽然 树 浅 了 ， 
但 是 a 个 儿子 中 的 最 小 者 是 必须 要 找 出 的 ， 如 使 用 标准 的 算法 ， 这 会 花费 d 一 1 次 比较 ， 于 





© ”我们 用 OCC log(k 十 1)) 而 不 用 OCC log k) Dake R= 1 情形 的 混乱 。 
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是 将 此 操作 的 用 时 提高 到 OCd log, N), WR d 是 常数 ， 那 么 当然 两 种 操作 的 运行 时 间 都 是 
O(log N)。 虽 然 仍然 可 以 使 用 一 个 数组 ， 但 是， 现在 找 出 儿子 和 父亲 的 乘法 和 除法 都 有 个 
KHF d, KRIE d 是 2 的 究 ， 否 则 将 会 大 大 地 增加 运行 时 间 ， 因 为 我 们 再 也 不 能 通过 二 进 制 
移 位 来 实现 除法 了 。d- 堆 在 理论 上 很 有 趣 ， 因 为 存在 许多 算法 ， 其 插入 次 数 比 DeleteMin 
的 次 数 多 很 多 (因此 理论 上 的 加 速 是 可 能 的 )。 当 优先 队列 太 大 不 能 完全 装 入 主 存 的 时 候 ， 
d- 堆 也 是 很 有 用 的 。 在 这 种 情况 下 ，d- 堆 能 够 以 与 B 树 大 致 相同 的 方式 发 挥 作用 。 最 后 ， 
有 证 据 显 示 ， 在 实践 中 4- 堆 可 以 胜 过 二 叉 堆 。 
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图 6-19 —^4 d-t 
除 不 能 执行 Find 外 ， 堆 的 实现 最 明显 的 缺点 是 : 将 两 个 堆 合并 成 一 个 堆 是 困难 的 操 
作 。 这 种 附加 的 操作 叫 作 Merge( 合 并 )。 存 在 许多 实现 堆 的 方法 使 得 Merge 操作 的 运行 时 
间 是 O(log N)。 现 在 我 们 就 来 讨论 三 种 复杂 程度 不 一 的 数据 结构 ， 它 们 都 有 效 地 支持 
Merge 操作 。 我 们 将 把 复杂 的 分 析 推 迟到 第 11 章 讨 论 。 


6.6 AHE 


设计 一 种 堆 结构 像 二 又 堆 那 样 高 效 地 支持 合并 操作 ( 即 以 OCN) 时 间 处 理 一 次 Merge? 
而 且 只 使 用 一 个 数组 似乎 很 困难 。 原 因 在 于 ， 合 并 似乎 需要 把 一 个 数组 拷贝 到 另 一 个 数组 
中 ， 对 于 相同 大 小 的 堆 这 将 花费 BCN) 时 间 。 因 此 ， 所 有 支持 高 效 合 并 的 高 级 数据 结构 都 需 
要 使 用 指针 。 实 践 中 ， 可 能 我 们 预计 这 将 使 得 所 有 其 他 的 操作 变 慢 一 一 处 理 指针 一 般 比 用 2 
作 乘 法 和 除法 更 耗费 时 间 。 

像 二 又 堆 那 样 ， 左 式 堆 (leftist heap) 也 具有 结构 特性 和 有 序 性 。 事 实 上 ， 和 所 有 使 用 的 
堆 一 样 ， 左 式 堆 具 有 相同 的 堆 序 性 质 ， 该 性 质 我 们 已 经 看 到 过 。 不 仅 如 此 ， 左 式 堆 也 是 二 
义 树 。 左 式 堆 和 二 又 树 间 唯 一 的 区 别 是 ， 左 式 堆 不 是 理想 平衡 的 (perfectly balanced) ， 而 实 
际 上 是 趋向 于 非常 不 平衡 的 。 


6.6.1 左 式 堆 的 性 质 


我 们 把 任意 节点 X 的 零 路 径 长 (Null Path Length，NPL)INPp1(X) 定 义 为 从 X 到 一 个 没 
有 两 个 儿子 的 节点 的 最 短路 径 的 长 。 因 此 ， 具 有 0 个 或 工 个 儿子 的 节点 的 Npl 为 0， 而 
Np1 (NULD) 王 一 1。 在 图 6-20 的 树 中 ， 零 路 径 长 标记 在 树 的 节点 内 。 

注意 ,任意 节 点 的 零 路 径 长 比 它 的 诸 儿 子 节点 的 零 路 径 长 的 最 小 值 多 1。 这 个 结 ; 
用 少 于 两 个 儿子 的 节点 ， 因 为 NULL 的 零 路 径 长 是 一 1。 
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图 6-20 两 棵 树 的 零 路 径 长 ， 只 有 左边 的 树 是 左 式 树 


左 式 堆 的 性 质 是 : 对 于 堆 中 的 每 一 个 节点 X， 左 儿子 的 零 路 径 长 至 少 与 右 儿 子 的 零 路 
径 长 一 样 大 。 图 6-20 中 只 有 一 棵 树 ( 即 左边 的 那 棵 树 ) 满 足 该 性 质 。 这 个 性 质 实际 上 超出 了 
它 确保 树 不 平衡 的 要 求 ， 因为 它 显 然 更 偏重 于 使 树 向 左 增 加 深度 。 确 实 有 可 能 存在 由 左 节 
点 形成 的 长 路 径 构成 的 树 ( 而 且 实际 上 更 便于 合并 操作 ) 一 一 因此 ， 我 们 就 有 了 左 式 扒 (left- 
ist heap) 这 个 名 称 。 

因为 左 式 堆 趋 向 于 加 深 左 路 径 ， 所 以 右 路 径 应 该 得。 事实 上 ， 沿 左 式 堆 的 右 路 径 确 实 
是 该 堆 中 最 短 的 路 径 。 否 则 ， 就 会 存在 一 条 路 径 通过 某 个 节点 X 并 取得 左 儿 子 。 此 时 的 X 
则 破坏 了 左 式 堆 的 性 质 。 

定理 6.2 在 右 路 径 上 有 六 个 节点 的 左 式 树 必 然 至 少 有 2 "一 1] 个 节点 。 

证 明 : 数学 归纳 法 证 明 。 如 果 r= 二 1， 则 必然 至 少 存在 一 个 树 节点 。 另 外 ， 设 定理 对 I. 

六 个 节点 成 立 。 考 虑 在 右 路 径 上 有 r 十 1 个 节点 的 左 式 树 。 此 时 ， 根 具有 在 右 路 径 上 
r 个 市 点 的 右 子 树 ， 以 及 在 右 路 径 上 至 少 含 7 个 节点 的 左 子 树 ( 否 则 它 就 不 是 左 式 树 )。 对 
这 两 棵 子 树 应 用 归纳 假设 ,得 知 在 每 棵 子 树 上 最 省 有 2’ 一 1 个 节点 ， 再 加 上 根 节 点 ， 于 是 
该 树 上 至 少 有 2 "一 1 个 节点 ， 定 理 得 证 。 

从 这 个 定理 立刻 得 到 ， 个 节点 的 左 式 树 有 一 条 右 路 径 最 多 含有 |L log(CN 二 1) 个 节点 。 
对 左 式 堆 操作 的 一 般 思 路 是 将 所 有 的 工作 放 到 右 路 径 上 进行 ， 它 保证 树 深 短 。 唯 一 的 国手 
部 分 在 于 ， 对 右 路 径 的 Insert 和 Merge 可 能 会 破坏 左 式 堆 性 质 。 事 实 上 ， 恢 复 该 性 质 是 
非常 容易 的 。 
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6.6.2 左 式 堆 的 操作 
对 左 式 堆 的 基本 操作 是 合并 。 注 意 , 插入 只 是 合并 的 特殊 情形 ， 因 为 我 们 可 以 把 插入 
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路 径 长 的 项 。 

如 果 这 两 个 堆 中 有 一 个 堆 是 空 的， 那么 我 们 可 以 返回 另外 一 个 堆 。 和 否则， 为 了 合并 这 两 
PH, 我们 需要 比较 它们 的 根 。 首 先 ， 我 们 将 具有 大 的 根 值 的 堆 与 具有 小 的 根 值 的 堆 的 右 子 
堆 合 并 。 在 本 例 中 ,我们 递归 地 将 H, 与 H, 中 根 在 8 处 的 右 子 堆 合并 ， 得 到 图 6-22 中 的 堆 。 
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图 6-22 #H 与 H, 的 右 子 堆 合 并 的 结果 


由 于 这 棵 树 是 递归 地 形成 的 ， 而 我 们 尚未 对 算法 描述 完毕 ， 因 此 ， 我们 现在 还 不 能 说 明 
该 堆 是 如 何 得 到 的 。 不 过 ， 有 理由 假设 ， 最 后 的 结果 是 一 棵 左 式 堆 ， 因 为 它 是 通过 递归 的 步 
又 得 到 的 。 这 很 像 归 纳 法 证 明 中 的 归纳 假设 。 既 然 我 们 能 够 处 理 基准 情形 (发 生 在 一 棵 树 是 空 
的 时 候 )， 当 然 可 以 假设 ， 只 要 我 们 能 够 完成 合并 那么 递归 步骤 就 是 成 立 的 ; 这 是 递归 法 则 3， 
我 们 在 第 1 童 中 讨论 过 它 。 现 在 ,我 们 让 这 个 新 的 堆 成 为 H 的 根 的 右 儿子 ( 见 图 6-23)。 





图 6-23 Hi 接 上 图 6-22 中 的 左 式 堆 作 为 右 儿子 的 结果 


虽然 最 后 得 到 的 堆 满 足 堆 序 性 质 ， 但 是 ， 它 不 是 左 式 堆 ， 因 为 根 的 左 子 树 的 零 路 径 长 为 1 
而 根 的 右 子 树 的 零 路 径 长 为 2。 因此 ， 左 式 的 性 质 在 根 处 被 破坏 。 不 过 ， 容 易 看 到 ， 树 的 其 余 
部 分 必然 是 左 式 的 。 由 于 递归 步 又 ， 根 的 右 子 树 是 左 式 的 。 根 的 左 子 树 没 有 变化 ， 当 然 它 也 
必然 还 是 左 式 的 。 这 样 一 来 ， 我 们 只 要 对 根 进行 调整 就 可 以 了 。 使 整个 树 是 左 式 的 做 法 如 下 : 
只 要 交换 根 的 左 儿 子 和 右 儿 子 ( 见 图 6-24) 并 更 新 零 路 径 长 ， 就 完成 了 Merge， 新 的 零 路 径 长 
是 新 的 右 儿 子 的 零 路 径 长 加 1。 注 意 ， 如 果 零 路 径 长 不 更 新 ， 那么 所 有 的 零 路 径 长 都 将 是 0， 
而 堆 将 不 是 左 式 的 ， 只 是 随机 的 。 在 这 种 情况 下 ， 算 法 仍然 成 立 ， 但 是 ,我们 宣称 的 时 间 界 
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将 不 再 有 效 。 
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图 6-24 交换 H, 的 根 的 儿子 得 到 的 结果 


将 算法 的 描述 直接 翻译 成 代码 。 除 了 增加 Np1( 零 路 径 长 ) 域 外 ， 算 法 中 的 类 型 定义 ( 见 
图 6-25) 与 二 叉 树 是 相同 的 。 我 们 在 第 4 章 已 经 看 到 ， 当 将 一 个 元 素 搬 和 到 一 棵 空 的 二 叉 树 
时 ， 需 要 改变 指向 根 的 指针 。 最 容易 的 实现 方法 是 让 搬入 例 程 返回 指向 新 树 的 指针 。 不 幸 的 
是 ， 这 将 使 得 左 式 堆 的 Insert 与 二 叉 堆 的 Insert 不 兼容 (后 者 什么 也 不 返回 )。 图 6-25 的 
最 后 一 行 描述 了 摆脱 这 种 窘境 的 一 种 方法 。 返 回 新 树 的 左 式 堆 插入 例 程 将 记 为 Inserti: A 
Insert 将 完成 一 次 与 二 叉 堆 兼容 的 插 和 人 操作。 这 种 使 用 宏 的 方法 可 能 不 是 最 好 和 最 安全 的 


, 





#ifndef | LeftHeap. H 


struct TreeNode; 
typedef struct TreeNode *PriorityQueue; 


/* Minimal set of priority queue operations */ 

/* Note that nodes will be shared among several */ 
/* leftist heaps after a merge; the user must */ 
/* make sure to not use the old leftist heaps */ 


PriorityQueue Initialize( void ); 

ElementType FindMin( PriorityQueue H ); 

int IsEmpty( PriorityQueue H ); 

PriorityQueue Merge( PriorityQueue H1, PriorityQueue H2 ); 


define Insert( X, H) C H = Insert1( (X), HJ) 
/* DeleteMin macro is left as an exercise */ 


PriorityQueue Insertl( ElementType X, PriorityQueue H ); 
PriorityQueue DeleteMinl( PriorityQueue H ); 


#endif 


/* Place in implementation file */ 
struct TreeNode 
{ 
ElementType Element; 
PriorityQueue Left; 
PriorityQueue Right; 
int Npl; 











图 6-25 左 式 堆 类 型 声明 
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WOE. 但 男 一 种 方法 ( 即 把 PriorityQueue 声明 为 指向 TreeNode 的 指针 ) 则 使 程序 充满 
了 人 额外 的 星 号 ” 。 

因为 Insert 是 一 个 安 并 且 将 被 预 处 理 程序 替换 ， 所 以 任何 调用 Insert 的 例 程 必须 
能 够 见 到 宏 定义 。 图 6-25 是 一 个 典型 的 头 文件 ， 将 宏 声 明 放 在 那里 是 唯一 合适 的 办 法 。 后 
面 将 会 看 到 ，DeleteMin 也 需要 写成 宏 的 形式 。 

合并 操作 的 例 程 ( 见 图 6-26) 是 一 个 被 设计 成 除去 一 些 特殊 情形 并 保证 Hs 有 较 小 根 的 
驱动 例 程 。 实 际 的 合并 操作 在 Mergel 中 进行 ( 见 图 6-27) 。 注 意 ， 原 始 的 两 个 左 式 堆 绝 不 
要 再 使 用 ， Bla eee OAE 





PriorityQueue 
Merge( PriorityQueue H1, PriorityQueue H2 ) 
1 


yE Lp TFC H1 == NULL J 

/[* 2*/ return H2; 

pe 3*7 ifC H2 == NULL J 

/[* 4*/ return H1; 

/* 5*j/ ifC H1l->Element < H2->Element ) 

£* CFF return Mergel( H1, H2 ); 
else 

£8 T7T*/ return Mergel( H2, H1 ); 











图 6-26 合并 左 式 堆 的 驱动 例 程 





static PriorityQueue 
Mergel( PriorityQueue H1, PriorityQueue H2 ) 
{ 


/* 1*/ ifC Hl-»Left == NULL ) /* Single node */ 
y* 2 H1->Left = H2; /* H1->Right is already NULL, 
H1-»Npl is already 0 */ 

else 
{ 

/* 3*/ H1->Right = Merge( H1->Right, H2 ); 

f[* 4*/ if( Hl->Left->Npl < H1->Right->Np1 ) 

f= Sy SwapChildren( H1 ); 

fe 657 H1-»Npl = Hl-»Right-»Npl + 1; 
} 

f" T return H1; 











图 6-27 合并 左 式 堆 的 实际 例 程 


执行 合并 的 时 间 与 右 路 径 的 长 的 和 成 正比 ， 因 为 在 递归 调用 期 间 对 每 一 个 被 访问 的 节 
点 执行 的 是 常数 工作 量 。 因 此 ， 我 们 得 到 合并 两 个 左 式 堆 的 时 间 界 为 O(log N)。 我 们 也 可 
以 分 两 趟 来 非 递 归 地 实施 该 操作 。 在 第 一 赵 ， 我 们 通过 合并 两 个 堆 的 右 路 径 建 立 一 棵 新 的 
树 。 为 此 ， 我 们 以 排序 的 顺序 安排 H 和 Ho 右 路 径 上 的 节点 ,保持 它们 各 自 的 左 儿子 不 
变 。 在 我 们 的 例子 中 ， 新 的 右 路 径 是 3，6，7，8，18， 而 最 后 得 到 的 树 如 图 6-28 所 示 。 第 
二 趟 构成 堆 ， 儿 子 的 交换 工作 在 左 式 堆 性 质 被 破坏 的 那些 节点 上 进行 。 在 图 6-28 中 ， 在 节 
点 7 和 3 有 一 次 交换 ， 并 得 到 与 前 面相 同 的 树 。 非 递归 的 做 法 更 容易 理解 ， 但 编程 困难 。 
我 们 留 给 读者 去 证 明 : 递归 过 程 和 非 递归 过 程 的 结果 是 相同 的 。 





Q 另 一 种 可 能 是 把 这 些 不 兼容 的 接口 看 作 必 然 的 整 端 接受 下 来 。 
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图 6-28 AHH, MH. 的 右 路 径 的 结果 


上 面 提 到 ， 我 们 可 以 通过 把 待 插入 项 看 成 单 节点 堆 并 执行 一 次 Merge 来 完成 插入 。 为 
了 执行 DeleteMin， 只 要 除 掉 根 而 得 到 两 个 堆 ， 然 后 再 将 这 两 个 堆 合 并 。 因 此 ， 执 行 一 次 
DeleteMin 的 时 间 为 O(log N)。 这 两 个 例 程 在 图 6-29 和 图 6-30 中 给 出 。DeleteMin 可 
JERE, EIA] DeleteMini 和 FindMin。 我 们 把 它 留 作 读 者 的 一 道 练习 题 。 

















PriorityQueue 
Insertl( ElementType X, PriorityQueue H ) 
{ 
PriorityQueue SingleNode; 
L /* 1*f/ SingleNode = malloc( sizeof( struct TreeNode ) ); 
y* 2*/ if( SingleNode == NULL ) 
f* 3*/ FatalError( "Out of space!!!" ); 
else 
{ 
J= 4*/ SingleNode->Element = X; SingleNode-»Npl = 0; 
fh SKY SingleNode->Left = SingleNode->Right = NULL; 
/* 6*/ H = Merge( SingleNode, H ); 
} 
/* 7*/ return H; 
} 
E 6-29 Aste MA BIE 
/* DeleteMinl returns the new tree; */ i 
/* To get the minimum, use FindMin */ 
/* This is for convenience */ 
PriorityQueue 
DeleteMinl( PriorityQueue H ) 
{ 
PriorityQueue LeftHeap, RightHeap; 
Va 35/ ifC IsEmpty( H ) ) 
{ 
fe 257 Error( "Priority queue is empty" ); 
L® 3*4 return H; 
} 
J= Ary LeftHeap = H->Left; 
LEIT RightHeap = H->Right; 
/* GAS free( H ); 
/* 7*/ return Merge( LeftHeap, RightHeap ); 
} 











A 6-30 左 式 堆 的 DeleteMin $I 
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最 后 ， 我 们 可 以 通过 建立 一 个 二 叉 堆 (显然 用 指针 实现 ) 以 OCN) 时 间 建 立 一 个 左 式 堆 。 
尽管 二 叉 堆 显然 是 左 式 的 ， 但 它 未 必 是 最 佳 解 决 方案 ， 因 为 我 们 得 到 的 堆 可 能 是 最 差 的 左 
式 堆 。 不 仅 如 此 ， 以 相反 的 层 序 遍历 树 也 不 像 用 指针 那么 容易 。BuilqdHeap 的 效果 可 以 通 
过 递归 地 建立 左右 子 树 然 后 将 根 下 滤 而 得 到 。 练 习 中 包含 另外 一 个 解决 方案 。 


6.7 RHE 


4HÉ (skew heap) 是 左 式 堆 的 自 调节 形式 ， 实 现 起 来 极其 简单 。 斜 堆 和 左 式 堆 间 的 关系 
类 似 于 伸展 树 和 AVL 树 间 的 关系 。 斜 堆 是 具有 堆 序 的 二 叉 树 ， 但 是 不 存在 对 树 的 结构 限 
制 。 不 同 于 左 式 堆 ， 关 于 任意 节点 的 零 路 径 长 的 任何 信息 都 不 保留 。 斜 堆 的 右 路 径 在 任何 
时 刻 都 可 以 任意 长 ， 因 此 ， 所 有 操作 的 最 坏 情形 运行 时 间 均 为 OOCN)。 然 而 ， 正 如 伸展 树 一 
样 ， 可 以 证 明 ( 见 第 11 章 ) 任 意 M 次 连续 操作 ， 总 的 最 坏 情形 运行 时 间 是 OCM log N)。 因 
此 ， 斜 堆 每 次 操作 的 摊 还 时 间 (amortized cost) 为 O(log N). 

与 左 式 堆 相 同 ， 斜 堆 的 基本 操作 也 是 合并 操作 。 这 个 Merge 例 程 还 是 递归 的 ， 我 们 执 
行 与 以 前 完全 相同 的 操作 ， 但 有 一 个 例外 ， 即 对 于 左 式 堆 ， 我 们 查看 是 否 左 儿子 和 右 儿 子 
满足 左 式 堆 堆 序 性 质 并 交换 那些 不 满足 该 性 质 者 ;但 对 于 斜 堆 ， 除 了 这 些 右 路 径 上 所 有 节 
点 的 最 大 者 不 交换 它们 的 左右 儿子 外 ， 交 ® 

=) 


换 是 无 条 件 的 。 这 个 例外 就 是 在 自然 递归 ^ 
实现 时 所 发 生 的 现象 ， 因 此 它 实 际 上 根本 ) 
不 是 特殊 情形 。 不 仅 如 此 ,证 明 时 间 界 也 AN 
RAW. WH, BTKSASEES © OO © B 

有 有 儿子， 因此 执行 交换 是 思春 的 。( 在 我 们 mj 本 S 
iss) 的 例子 中 ,该 节点 没有 儿子 ， 因 此 我 们 不 
ho 必 为 此 担心 .) 另 外 ， 仍 设 我 们 的 输入 是 与 TM 
CU 前 面相 同 的 两 个 堆 ， 见 图 6-31. 

如 果 我 们 递归 地 将 He 5 H, 中 根 在 8 处 的 子 堆 合并 ， 那 么 将 得 到 图 6-32 中 的 堆 ， 
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图 6-32 将 H: SH 的 右 子 堆 合 并 的 结果 


这 也 是 递归 地 完成 的 ， 因 此 ， 根 据 递归 的 第 三 个 法 则 ( 见 1. 3 节 ) 我 们 不 必 担 心 它 是 如 
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何 得 到 的 。 这 个 堆 碰 巧 是 左 式 的 ， 不 过 不 能 保证 情况 总 是 如 此 。 我 们 使 这 个 堆 成 为 H, 的 新 
的 左 儿 子 ， 而 H, 的 老 的 左 儿子 变 成 了 新 的 右 儿子 ( 见 图 6-33)。 





6-33 合并 斜 堆 H, MH. 的 结果 


整 棵 树 是 左 式 的 ， 但 是 容易 看 到 这 并 不 总 是 成 立 的 : 将 15 插入 到 新 堆 中 将 破坏 左 式 性 质 。 

我 们 也 可 像 左 式 堆 那 样 非 递归 地 进行 所 有 的 操作 : 合并 右 路 径 ， 除 最 后 的 节点 外 交换 
右 路 径 上 每 个 节点 的 左 儿子 和 右 儿 子 。 经 过 儿 个 例子 之 后 ,事情 变 得 很 清楚 : 由 于 除去 右 
路 径 上 最 后 的 节点 外 的 所 有 节点 都 将 它们 的 儿子 交换 ， 因 此 最 终 效 果 是 它 变 成 了 新 的 左 路 
径 ( 人 参见 前 面 的 例子 ) 。 这 使 得 合并 两 个 斜 堆 非 常 容 易 ” 。 

斜 堆 的 实现 留 作 练习 。 注 意 ， 因 为 右 路 径 可 能 很 长 ， 所 以 递归 实现 可 能 由 于 缺乏 栈 空 
间 而 失败 ， 虽 然 在 其 他 方面 性 能 是 可 接受 的 。 斜 堆 有 一 个 优点 ， 即 不 需要 附加 的 空间 来 保 
留 路 径 长 以 及 不 需要 测试 确定 何 时 交换 儿子 。 精 确 确 定 左 式 堆 和 和 斜 堆 的 期 望 的 右 路 径 长 是 
一 个 尚未 解决 的 问题 (后 者 无 疑 更 为 困难 )。 这 样 的 比较 将 更 容易 确定 平衡 信息 的 轻微 遗失 
是 否 可 由 缺少 测试 来 补偿 。 


6.8 一 项 队列 


虽然 左 式 堆 和 和 斜 堆 每 次 操作 花费 O(log N) 时 间 ， 这 有 效 地 支持 了 合并 、 插 入 和 
DeleteMin， 但 还 是 有 改进 的 余地 ， 因 为 我 们 知道 ， 二 叉 堆 以 每 次 操作 花费 常数 平均 时 间 
支持 插入 。 二 项 队列 支持 所 有 这 三 种 操作 ， 每 次 操作 的 最 坏 情 形 运行 时 间 为 O(log N), m 
插入 操作 平均 花费 常数 时 间 。 


6. 8.1 二 项 队列 结构 


二 项 队列 (binomial queue) 不 同 于 我 们 已 经 看 到 的 所 有 优先 队列 的 实现 之 处 在 于 ， 一 个 二 
项 队列 不 是 一 棵 堆 序 的 树 ， 而 是 堆 序 树 的 集合 ， 称 为 森林 (forest)。 堆 序 树 中 的 每 一 棵 都 是 有 





日 ”这 与 递归 实现 不 完全 一 样 ( 但 服从 相同 的 时 间 界 )。 如 果 一 个 堆 的 右 路 径 用 完 而 导致 右 路 径 合 并 终止 ， 而 我 们 
只 交换 终止 的 那 一 点 上 面 的 右 路 径 上 的 节点 的 儿子 ,那么 将 得 到 与 递归 做 法 相同 的 结果 。 
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约束 的 形式 ， 叫 作 二 项 树 (binomial tree. 后 面 将 看 到 该 名 称 的 由 来 是 显然 的 )。 每 一 个 高 度 上 
至 多 存在 一 棵 二 项 树 。 高 度 为 0 的 二 项 树 是 一 棵 单 节 点 树 ; 高 度 为 & 的 二 项 树 B, 通过 将 一 棵 
二 项 树 B,_1 附 接 到 另 一 棵 二 项 树 B, 1 的 根 上 而 构成 。 图 6-34 显示 二 项 树 B,、B,、B,、B; 以 


R Bys 
x Jo "bo Sa 
vu 


B, 


O 


图 6-34 二 项 树 Bo, Bi, Bo, B ARB, 
从 图 中 看 到 ， 二 项 树 B 由 一 个 带 有 儿子 B,，B!，…，B, 1 的 根 组 成 。 高 度 为 & 的 二 
k 
项 树 恰好 有 2^ 个 节点 ， 而 在 深度 d 处 的 节点 数 是 二 项 系数 | 。 如 果 我 们 把 堆 序 施加 到 二 


项 树 上 并 允许 任意 高 度 上 最 多 有 一 棵 二 项 树 ， 那 么 我 们 能 够 用 二 项 树 的 集合 唯一 地 表示 任 
意 大 小 的 优先 队列 。 例 如 ， 大 小 为 13 的 优先 队列 可 以 用 森林 Bs. Bo, Bo 表示 。 我 们 可 以 
把 这 种 表示 写成 1101， 它 不 仅 以 二 进 制 表 示 了 13， 而 且 也 表示 这 样 的 事实 : 在 上 述 表 示 
H, B, B, B 出 现 ， 而 By 则 没有 。 

举 一 个 例子 ， 六 个 元 素 的 优先 队列 可 以 表示 为 图 6-35 中 的 形状 。 


| (16) 12 
682 二 项 队列 操作 T Ce DA 


此 时 ， 最 小 元 可 以 通过 搜索 所 有 的 树 的 根来 找 出 。 由 e) 
于 最 多 有 log N 棵 不 同 的 树 ， 因 此 最 小 元 可 以 在 O(log N) 
时 间 内 找到 。 另 外 ， 如 果 我 们 记得 当 最 小 元 在 其 他 操作 


图 6-35 具有 六 个 元 素 的 二 项 树 H 


期 间 变 化 时 更 新 它 ， 那 么 我 们 也 可 保留 最 小 元 的 信息 并 . ON Q 
以 O(1) 时 间 执 行 该 操作 。 (18) we. 
合并 两 个 二 项 队列 的 操作 在 概念 上 是 容易 的 操作 ， S 


我 们 将 通过 例子 描述 。 考 虑 两 个 二 项 队列 H, 和 HL, € ES 

们 分 别 具 有 六 个 和 七 个 元 素 ， 见 图 6-36, ae ÉIE 
合并 操作 基本 上 是 通过 将 两 个 队列 加 到 一 起 来 完成 9 

Bg. SH; 是 新 的 二 项 队列 。 由 于 H 没有 高 度 为 -0 的 二 图 6-36 两 个 二 项 队列 H, 和 H 


第 6 章 优先 队列 ( 堆 ) 


THUR AL 有， 因此 我 们 就 用 Ho 中 高 度 为 0 的 二 项 树 作为 H, 的 一 部 分 。 然 后 ,我们 将 两 
个 高 度 为 1 的 二 项 树 相 加 。 由 于 A, 和 HH, 都 有 高 度 为 c 

1 的 二 项 树 ， 因 此 我 们 可 以 将 它们 合并 ， 让 大 的 根 成 为 (6) “(16 

小 的 根 的 子 树 ， 从 而 建立 高 度 为 2 的 二 项 树 ， 见 

图 6-37。 这 样 H, 将 没有 高 度 为 1 的 二 项 树 。 现 在 存 
在 三 棵 高 度 为 2 的 二 项 树 ， 即 Hl 和 Ho 原 有 的 两 棵 二 
项 树 以 及 由 上 一 步 形成 的 一 棵 二 项 树 。 我 们 将 一 棵 高 度 为 2 的 二 项 树 放 到 Hs 中 ， 并 合并 其 
他 两 棵 二 项 树 ， 得 到 一 棵 高 度 为 3 的 二 项 树 。 由 于 H 和 H 都 没有 高 度 为 3 的 二 项 树 ， 因 
WIZ EM H: 的 一 部 分 ， 合 并 结束 。 最 后 得 到 的 二 项 队列 如 图 6-38 所 示 。 


图 6-37 H, 和 H: PRR B, HAH 


He A = AI 一 


6-38 二 项 队列 Hi: 合并 H, MH. 的 结果 


由 于 几乎 使 用 任意 合理 的 实现 方法 合并 两 棵 二 项 树 均 花费 常数 时 间 ， 而 总 共存 在 
O(log N) 棵 二 项 树 ， 因 此 合并 在 最 坏 情 形 下 花费 O(log N) 时 间 。 为 使 该 操作 更 高 效 ， 我 们 
需要 将 这 些 树 放 到 按照 高 度 排序 的 二 项 队列 中 ， 当 然 这 做 起 来 是 件 简单 的 事情 。 

插入 实 慰 上 就 是 特殊 情形 的 合并 ， 我们 只 要 创建 一 棵 单 节点 树 并 执行 一 次 合并 。 这 种 
操作 的 最 坏 情 形 运行 时 间 也 是 O(log N) 。 更 准确 地 说 ， 如 果 元 素 将 要 搬入 的 那个 优先 队列 
中 不 存在 的 最 小 的 二 项 树 是 B;， 那 么 运行 时 间 与 i 二 1 RE. Aan, H ILE 6-38) 缺 少 
高 度 为 1 的 二 项 树 ， 因 此 插入 将 进行 两 步 后 终止 。 由 于 二 项 队列 中 的 每 棵 树 出 现 的 概率 均 
为 1/2， 于 是 我 们 期 望 插入 在 两 步 后 终止 , 因此， 平均 时 间 是 常数 。 不 仅 如 此 ， 分 析 将 指 
出 ， 对 一 个 初始 为 空 的 二 项 队列 进行 N 次 Insert 将 花费 的 最 坏 情 形 时 间 为 O(N)。 事 实 
上 ， 只 用 N 一 1 次 比较 就 有 可 能 进行 该 操作 ， 我 们 把 它 留 作 练 习 。 

举 一 个 例子 ,我 们 用 图 6-39 到 图 6-45 演示 通过 依 序 插入 1 到 7 来 构成 一 个 二 项 队列 。 
4 的 插入 展现 一 种 坏 的 情形 。 我 们 把 4 与 B, 合并 ， 得 到 一 棵 新 的 高 度 为 1 的 树 。 然 后 将 该 
树 与 B, 合并 ， 得 到 一 棵 高 度 为 2 的 树 ， 它 是 新 的 优先 队列 。 我 们 把 这 些 算 作 三 步 ( 两 次 树 
合并 加 上 终止 情形 )。 在 插入 7 以 后 的 下 一 次 插入 又 是 一 个 坏 情形 ， 需 要 三 次 树 合并 操作 。 


(1 ©) 
a a. 


Q (2) 
图 6-39 在 1 插入 之 后 图 6-40 在 2 插入 之 后 图 6-41 在 3 插入 之 后 
o (5) 1 o 
2) 2 ^ 2) 13 
Q) 4) 4) 
A 6-42 在 4 插入 之 后 图 6-43 在 5 插入 之 后 图 6-44 在 6 插入 之 后 
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DeleteMin 可 以 通过 首先 找 出 一 棵 具有 最 小 根 的 二 项 树 来 完成 。 令 该 树 为 Ba HS 
原始 的 优先 队列 为 H., RITA H 的 树 的 森林 中 除去 二 项 树 Ono) 

B， 形 成 新 的 二 项 树 队列 H. HRE B, 的 根 ， 得 到 一 些 二 项 
W B。，B,，…，B-!， 它 们 共同 形成 优先 队列 H”. AIF H' Da 
和 H”, RER. 

例如 ， 设 对 H; 执行 一 次 DeleteMin. WA 6-46 所 示 。 
最 小 的 根 是 12， 因 此 我 们 得 到 图 6-47 和 图 6-48 中 的 两 个 优先 队列 HUN H", JEH'RH' 
得 到 的 二 项 队列 是 最 后 的 答案 ， 见 图 6-49 。 


图 6-45 在 7 插入 之 后 


PRO 12 
51) Q4 (21) Q4) 14 
65 (65) 26) (16) 
(18) 
图 6-46 二 项 队列 H; 
y © (DQ @ 
51) (24 (63) (26) (16 
(65) 18) 
Æ 6-47 二 项 队列 H, B&R B. 外 H 中 图 6-48 二 项 队列 H: 除去 12 后 的 B. 
所 有 的 二 项 树 


为 了 分 析 ， 首 先 注意 DeleteMin 操作 将 A A 
原 二 项 队列 一 分 为 二 。 找 出 含有 最 小 元 素 的 51) Q3) 21) (24) (14) 
树 并 创建 队列 HH! A 下" 花费 O(log N) 时 间 。 65 o Da, 
18 


合并 这 两 个 队列 又 花费 O(log N) 时 间 ， 因 此 ， 

Px . r1 -{ z Ny- 
整个 DeleteMin 操作 花费 O(log N) 时 间 。 Wide mindnek 
6.83 二 项 队列 的 实现 


DeleteMin 操作 需要 快速 找 出 根 的 所 有 子 树 的 能 力 ， 因 此 ， 需 要 一 般 树 的 标准 表示 
方法 一 一 每 个 节点 的 儿子 都 存在 一 个 链表 中 ， 而 且 每 个 节点 都 有 一 个 指向 它 的 第 一 个 儿 
子 ( 如 果 有 的 话 ) 的 指针 。 该 操作 还 要 求 诸 儿子 按照 它们 的 子 树 的 大 小 排序 。 我 们 也 需要 
保证 能 够 很 容易 地 合并 两 棵 树 。 当 合并 两 棵 树 时 ， 其 中 的 一 棵 树 作为 儿子 加 到 另 一 棵 树 
上 。 由 于 这 棵 新 树 将 是 最 大 的 子 树 ， 因 此 ， 以 大 小 递减 的 方式 保持 这 些 子 树 是 有 意义 的 。 
只 有 这 时 ， 我 们 才能 够 有 效 地 合并 两 棵 二 项 树 从 而 合并 两 个 二 项 队列 。 二 项 队列 将 是 二 
项 树 的 数组 。 

总 之 ， 二 项 树 的 每 一 个 节点 将 包含 数据 、 第 一 个 儿子 以 及 右 兄 弟 。 二 项 树 中 的 诸 儿 子 
以 递减 次 序 排列 。 

图 6-51 解释 如 何 表示 图 6-50 中 的 二 项 队列 。 图 6-52 显示 二 项 树 中 的 节点 的 类 型 声明 。 


$63 优先 队列 ( 堆 ) 











图 6-51 二 项 队列 Hi 的 表示 方式 


为 了 合并 两 个 二 项 队列 ,我 们 需要 一 个 例 程 来 
合并 两 个 同样 大 小 的 二 项 树 。 图 6-53 指出 两 个 二 项 
树 合 并 时 指针 是 如 何 变化 的 。 合 并 二 项 树 的 程序 很 
简单 ， 见 图 6-54, 

现在 我 们 介绍 Merge 例 程 的 简单 实现 。 该 例 
程 将 H, MH 合并 ， 把 合并 结果 放 和 HP, O3 
Z 甩 ; 。 在 任意 时 刻 我 们 在 处 理 的 是 秩 为 i 的 那些 
BE. T, AT. 分 别 是 H, FI Hs 中 的 树 ， 而 carry 
是 从 上 一 步 得 来 的 树 ( 可 能 是 NULL). WR T, ff 
fr. BAIT, 是 1， 否 则 !! T, 是 0， 对 其 余 的 树 
也 是 如 此 。 对 于 秩 为 i 以 及 秩 为 i 十 1 Carry 树 








typedef struct BinNode *Position; 
typedef struct Collection *BinQueue; 


struct BinNode 


ElementType Element; 
Position LeftChild; 
Position NextSibling; 


h 
struct Collection 
int CurrentSize; 


BinTree TheTrees[ MaxTrees ]; 


h 








图 6-52 二 项 队列 类 型 声明 


所 得 到 的 结果 形成 的 树 ， 其 形成 过 程 依赖 于 8 种 可 能 情形 中 的 每 一 种 。 该 过 程 从 秩 0 开始 


到 产生 二 项 队列 的 最 后 的 秩 。 程 序 见 图 6-55. 


二 项 队列 的 DeleteMin 例 程 在 图 6-56 中 给 出 。 
当 受 到 影响 的 元 素 的 位 置 已 知 时 ， 我 们 可 以 将 二 项 队列 扩展 到 支持 二 又 堆 所 允许 的 某 些 非 标 准 


的 操作 ， 诸 如 DecreaseKey 和 Delete. DecreaseKey 是 一 次 PercolateUp， 如 果 我 们 将 
一 个 域 加 到 每 个 节点 上 指向 其 父亲 ， 那 么 PercolateUp 可 以 在 O(log N) 时 间 内 完成 。 一 
次 任意 的 Delete 可 以 通过 结合 使 用 DecreaseKey 和 DeleteMin 以 O(log N) 时 间 完 成 。 


Ai 
KD D 
é AK 
N6 26 
(is) 


6-53 合并 两 棵 二 项 树 
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/* Return the result of merging equal-sized T1 and T2 */ 


BinTree 


CombineTrees( BinTree T1, BinTree T2 ) 


{ 


if( T1l->Element > T2->Element ) 
return CombineTrees( T2, T1 ); 

T2-»NextSibling = T1-»LeftChild; 

Tl1-»LeftChild = T2; 

return T1; 








6-54 合并 同样 大 小 的 两 棵 二 项 树 的 例 程 








/* Merge two binomial queues */ 
/* Not optimized for early termination */ 
/* H1 contains merged result */ 


BinQueue 


Merge( BinQueue H1, BinQueue H2 ) 


{ 


return H1; 


! 


BinTree T1, T2, Carry - NULL; 


int 4, 


if( H1-»CurrentSize + H2->CurrentSize > Capacity ) 
Error( "Merge would exceed capacity" ); 


Hl-»CurrentSize += H2->CurrentSize; 


for( i 


{ 


Ti 


switch( !!T1 + 2 * !!T2 + 4 * !!Carry ) 


{ 


! 
} 


Ji 


= 0; j= 1; j <= Hl->CurrentSize; i++, j *= 2) 


= Hl-»TheTrees[ i ]; T2 = H2->TheTrees[ i ]; 


case 0: /* No trees */ 

case 1: /* Only H1 */ 
break; 

case 2: /* Only H2 */ 
Hl-»TheTrees[ i ] = T2; 
H2-»TheTrees[ i ] = NULL; 
break; 

case 4: /* Only Carry */ 
H1->TheTrees[ i ] = Carry; 
Carry = NULL; 
break; 

case 3: /* H1 and H2 */ 
Carry = CombineTrees( T1, T2 ); 
Hl-»TheTrees[ i ] = H2-»TheTrees[ i ] = NULL; 
break; 

case 5: /* H1 and Carry */ 
Carry = CombineTrees( T1, Carry ); 
H1->TheTrees[ i ] = NULL; 
break; 

case 6: /* H2 and Carry */ 
Carry = CombineTrees( T2, Carry ); 
H2->TheTrees[ i ] = NULL; 
break; 

case 7: /* All three */ 
H1->TheTrees[ i ] = Carry; 
Carry = CombineTrees( T1, T2 ); 
H2-»TheTrees[ i ] = NULL; 
break; 








图 6-55 合并 两 个 优先 队列 的 例 程 


Q 总 结 








{ 


ElementType 
DeleteMin( BinQueue H ) 
int 1, js 
int MinTree; /* The tree with the minimum item */ 


BinQueue DeletedQueue; 
Position DeletedTree, OldRoot; 
ElementType MinItem; 


if( IsEmpty( H ) ) 
{ 


Error( "Empty binomial queue" ); 
return -Infinity; 


} 


MinItem = Infinity; 
for( i = 0; i < MaxTrees; i++ ) 
{ 
if( H->TheTrees[ i ] && 
H->TheTrees[ i ]->Element < MinItem ) 
{ 


/* Update minimum */ 
MinItem = H->TheTrees[ i ] ->Element; 
MinTree i; 


tow 


} 


DeletedTree = H->TheTrees[ MinTree ]; 
OldRoot = DeletedTree; 

DeletedTree = DeletedTree->LeftChild; 
free( OldRoot ); 


DeletedQueue = Initialize( ); 
DeletedQueue->CurrentSize = ( 1 << MinTree ) - 1; 
for( j = MinTree - 1; j >= 0; j-- D 
{ 
DeletedQueue->TheTrees[ j ] = DeletedTree; 
DeletedTree = DeletedTree->NextSibling; 
DeletedQueue->TheTrees[ j ]->NextSibling = NULL; 


} 
H->TheTrees[ MinTree ] = NULL; 
H->CurrentSize -= DeletedQueue->CurrentSize + 1; 


Merge( H, DeletedQueue ); 
return MinItem; 











图 6-56 二 项 队列 的 DeleteMin 


优先 队列 ( 堆 ) 


在 这 一 章 ， 我 们 已 经 看 到 优先 队列 ADT 的 各 种 实现 方法 和 用 途 。 标 准 的 二 叉 堆 实现 由 
于 简单 且 速 度 快 从 而 是 精致 的 。 它 不 需要 指针 ， 只 需要 常数 的 附加 空间 ， 且 有 效 支持 优先 





队列 的 操作 。 
我 人 





] 考 虑 了 另外 的 合并 操作 ,发展 了 三 种 实现 方法 ,每 种 都 有 其 独到 之 处 。 左 式 堆 是 


递归 强大 力量 的 完美 实例 。 斜 堆 则 是 代表 缺少 平衡 原则 的 一 种 重要 的 数据 结构 。 它 的 分 析 
是 有 趣 的 ， 我 们 将 在 第 11 章 进行 。 二 项 队列 表明 了 如 何 用 一 个 简单 的 想法 来 达到 好 的 时 


间 界 。 
我 人 





门 还 看 到 优先 队列 的 几 个 用 途 ， 从 操作 系统 的 工作 调度 到 模拟 。 我 们 将 在 第 7、9 和 
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10 章 再 次 看 到 它们 的 应 用 。 


Q 练习 


6. 


e» 


1 设 我 们 用 PindMin 替换 DeleteMin 函数 。 操 作 Insert 和 操作 FindMin 都 能 以 各 
数 时 间 实 现 吗 ? 


2 a Bie 10, 12, 1, 14, 8$, 5. 8, 15, 3, 9, 7T, 4, 11, WMA 


到 一 个 初始 为 空 的 二 叉 堆 中 的 结果 。 
b. 写 出 使 用 相同 的 输入 通过 线性 时 间 算 法 建立 一 个 二 又 堆 的 结果 。 


.3 写 出 在 练习 6.2 的 堆 中 执行 3 次 DeleteMin 操作 的 结果 。 
.4 编写 在 二 叉 堆 中 进行 上 泪 的 例 程 和 进行 下 小 的 例 程 。 
.5 写 出 并 测试 一 个 在 二 叉 堆 中 执行 Insert, DeleteMin, BuildHeap, FindMin, De- 








creaseKey, Delete 和 IncreaseKey 等 操作 的 程序 。 


.6 在 图 6-13 的 堆 中 有 和 多少 节 点? 
.7 a 证 明 对 于 二 叉 堆 ，BuildHeap 至 多 在 元 素 间 进行 2N 一 2 次 比较 。 


b. 证 明 8 个 元 素 的 堆 可 以 通过 堆 元 素 间 的 8 次 比较 构成 。 
exe 给 出 一 个 算法 ， 用 总 N 二 OUlog N) 次 元 素 比较 构建 出 一 个 二 又 堆 。 


.8 iB], 在 一 个 大 的 完全 堆 ( 你 可 以 假设 N=2 一 1) 中 第 个 最 小 元 的 期 望 深度 以 log k 


AR. 


. 9xa. 给 出 一 个 算法 以 找 出 二 叉 堆 中 小 于 某 个 值 X 的 所 有 节点 。 你 的 算法 应 该 以 O(K ) 运 


fr, Et, K 是 输出 的 节点 数 。 
. 你 的 算法 可 以 扩展 到 本 章 讨论 过 的 任何 其 他 堆 结 构 吗 ? 
xc. 给 出 一 个 算法 ， 最 多 使 用 大 约 3N /4 次 比较 找 出 二 叉 堆 中 任意 的 项 X。 
10 ”提出 一 个 算法 ， 用 O(M 十 log N log log N) 时 间 将 M 个 节点 插 和 人 到 N 个 元 素 的 二 又 
堆 中 。 证 明 你 的 时 间 界 。 
11 编写 一 个 程序 输入 N 个 元 素 并 执行 以 下 操作 : 
a. 将 它们 一 个 一 个 地 插入 到 一 个 堆 中 。 
b. 以 线性 时 间 建 立 一 个 堆 。 
比较 这 两 个 算法 对 于 已 排序 、 反 序 以 及 随机 输入 的 运行 时 间 。 
12 每 个 DeleteMin 操作 在 最 坏 情形 下 使 用 2 log N 次 比较 。 
xa. 提出 一 种 方案 使 得 DeleteMin 操作 只 使 用 log N 十 log log N 十 O(1) 次 元 素 间 的 
比较 。 这 未 必 意 味 着 较 少 的 数据 移动 。 
xb. 扩展 你 在 (a) 部 分 中 的 方案 使 得 只 执行 log N 十 log log log N 十 O(1) 次 比较 。 
xxc。 你 能 够 把 这 种 想法 推 向 多 远 ? 
d. 在 比较 中 节省 下 来 的 开销 能 否 补偿 你 的 算法 增加 的 复杂 性 ? 
13 ”如 果 一 个 d- 堆 作为 一 个 数组 存储 ， 那 么 对 位 于 位 置 i 的 项 ， 其 父亲 和 儿子 都 在 哪里 ? 


iom 
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6.14 设 一 个 d- 堆 初始 时 有 NN 个 元 素 ， 而 我 们 需要 对 其 执行 M 次 PercolateUp 和 N 次 
DeleteMin, 
a. FAM, N fd 表示 的 所 有 操作 的 总 的 运行 时 间 是 多 少 ? 
b. WR d 二 2， 所 有 的 堆 操 作 的 运行 时 间 是 多 少 ? 
c. 如 果 d 二 8(N)， 总 的 运行 时 间 是 多 少 ? 
xd. 对 d 作 什 么 选择 将 最 小 化 总 的 运行 时 间 ? 
6.15 最 小 -最 大 堆 (min-max heap) 是 支持 两 种 操作 DeleteMin 和 DeleteMax 的 数据 结 
构 ， 每 个 操作 用 时 O(log N)。 该 结构 与 二 又 堆 相同 ， 不 过 ， 其 堆 序 性 质 为 : 对 于 在 
偶数 深度 上 的 任意 节点 XX， 存储 在 X 上 的 关键 字 小 于 它 的 父亲 但 是 大 于 它 的 祖父 (这 
是 有 意义 的 ); 对 于 奇数 深度 上 的 任意 节点 X， 存 储 在 X 上 的 关键 字 大 于 它 的 父亲 但 
是 小 于 它 的 祖父 ， 见 图 6-57。 









































图 6-57 最 小 -最 大 堆 
a. 我 们 如 何 找 到 最 小 元 和 最 大 元 ? 
xb. 给 出 一 个 算法 将 一 个 新 节点 插入 到 该 最 小 -最 大 堆 中 。 
xc. 给 出 一 个 算法 执行 DeleteMin 和 DeleteMax。 
xd. 你 能 否 以 线性 时 间 建 立 一 个 最 小 -最 大 堆 ? 
xxe。 设 我 们 想 要 支持 操作 DeleteMin、DeleteMax 以 及 Merge。 提 出 一 种 数据 结构 
以 O(log N) 时 间 支 持 所 有 的 操作 。 
6.16 合并 图 6-58 中 的 两 个 左 式 堆 。 

















图 6-58 


6.17 写 出 依 序 将 关键 字 1 到 15 插入 一 个 初始 为 空 的 左 式 堆 中 的 结果 。 
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6. 


oo 


o 


O O o 


18 证 明 下 述 结 论 成 立 或 不 成 立 : 如 果 将 关键 字 1 到 2* 一 1 依 序 插入 到 一 个 初始 为 空 的 
左 式 堆 中 ， 那 么 结果 形成 一 棵 理想 平衡 树 (perfectly balanced tree), 
19 给 出 一 个 生成 最 佳 左 式 堆 的 输入 的 例子 。 


.20 a 左 式 堆 能 否 有 效 地 支持 DecreaseKey? 


b. 完成 该 功能 需要 哪些 变化 (如 果 可 能 的 话 )? 


.21 从 左 式 堆 中 一 个 已 知 位 置 删除 节点 的 一 种 方法 是 使 用 懒惰 策略 。 要 删除 一 个 节点 ， 


只 要 将 其 标记 为 已 删除 即 可 。 当 执行 一 个 FinaMin 或 DeleteMin 时 ， 若 标记 根 节 
点 被 删除 则 存在 一 个 潜在 的 问题 ， 因 为 此 时 节点 必须 被 实际 删除 且 需 要 找到 实际 的 
最 小 元 ， 这 可 能 涉及 删除 其 他 一 些 已 做 标记 的 节点 。 在 该 方法 中 ，Delete 化 费 一 个 
单位 ， 但 一 次 DeleteMin 或 FindMin 的 开销 却 依 赖 于 作 了 已 删除 标记 的 节点 的 个 
数 。 设 在 一 次 DeleteMin E FindMin 后 做 标记 的 节点 比 操作 前 少 了 k 个 。 

xxa. 说 明 如 何以 O(k log NN) 时 间 执 行 DeleteMin。 

xxb. 提出 一 种 实现 方法 ， 通 过 分 析 证 明 执 行 DeleteMin 的 时 间 为 O(k log(2N /k))。 


.22 ”我们 可 以 以 线性 时 间 对 左 式 堆 执 行 BuildHeap 操作 : 把 每 个 元 素 当 作 单 节点 左 式 


堆 ， 把 所 有 这 些 堆放 到 一 个 队列 中 。 之 后 ， 让 两 个 堆 出 队 ， 合 并 它们 ,再 将 合并 结 
果 人 队 ， 直 到 队列 中 只 有 一 个 堆 为 止 。 

a. 证 明 该 算法 在 最 坏 情形 下 为 O(NN)。 

b. 为 什么 该 算法 优 于 课文 中 描述 的 算法 ? 


.23 合并 图 6-58 中 的 两 个 斜 堆 。 
.24 写 出 将 关键 字 1 到 15 依 序 插 人 到 一 个 斜 堆 内 的 结果 。 
.25 证 明 下 述 结论 成 立 或 不 成 立 : 如 果 将 关键 字 1 到 2* 一 1 依 序 插入 到 一 个 初始 为 空 的 


和 斜 堆 中 ， 那 么 结果 形成 一 棵 理想 平衡 树 。 


.26 ”使 用 标准 的 二 叉 堆 算法 可 以 建立 一 个 含有 N 个 元 素 的 斜 堆 。 我 们 能 否 将 练习 6. 22 中 


描述 的 同样 的 合并 方法 用 于 斜 堆 而 得 到 O(NN) 运 行 时 间 ? 


27 证明 二 项 树 B, 以 二 项 树 B,，B, ，.…，B,_ ,作为 其 根 的 儿子 。 
k 

.28 证 明 高 度 为 的 二 项 树 在 深度 d 有 H 个 节点 。 

.29 将 图 6-59 中 的 两 个 二 项 队列 合并 。 


(3) ON 12 


DA DA 
© @) v 


© 
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6.30 a. 证 明 : 向 初始 为 空 的 二 项 队列 进行 N 次 Insert 最 坏 情形 下 的 运行 时 间 为 O(N)。 
b. 给 出 一 个 算法 来 建立 有 NN 个 元 素 的 二 项 队列 ， 在 元 素 间 最 多 使 用 N 一 1 次 比较 。 
*c. 提出 一 个 算法 ， 以 O(M 十 log N) 最 坏 情形 运行 时 间 将 M 个 节点 插入 到 含有 NN 个 
元 素 的 二 项 队列 中 。 证 明 你 的 界 。 
6.31 写 出 一 个 有 效 的 例 程 使 用 二 项 队列 来 完成 Insert 操作 。 不 要 调用 Merge. 
6.32 ”对 于 二 项 队列 : 
a. 当 调 用 Merge( 互 ， 互 ) 时 会 发 生 什么 情况 ? 修改 代码 以 修正 该 问题 。 
b. 如 果 在 H: 中 没有 树 留 下 且 carry 树 为 NULL ， 修 改 Merge 例 程 以 终止 合并 。 
c. 修改 Merge 使 得 较 小 的 树 总 被 合并 到 较 大 的 树 中 。 
xx6. 33 假设 我 们 将 二 项 队列 扩充 为 允许 每 个 结构 至 多 有 两 棵 相同 高 度 的 树 。 我 们 能 否 在 其 
他 操作 保留 为 O(log N) 时 实现 最 坏 情形 时 间 为 0(1) 的 插入 ? 


6.34 ” 设 有 许多 盒子 ， 每 个 盒子 都 能 容纳 总 重量 CA n. i, i, 0, in, ENA 
wy, We, W, c0, wo 现在 想 要 把 所 有 的 物品 包装 起 来 ， 但 任意 盒子 都 不 能 放置 


超过 其 容量 的 重 物 ， 而 且 要 使 用 尽量 少 的 盒子 。 例 如 ,， 若 C= 二 5， 物 品 分 别 重 2，2， 
3，3， 则 我 们 可 用 两 个 盒子 解决 该 问题 。 
一 般 说 来 ， 这 个 问题 很 难 ， 没 有 已 知 的 有 效 的 解决 方法 。 编 写 一 个 程序 ， 有 效 
地 实现 下 列 各 近似 策略 : 
xa. 将 物品 放 人 能 够 承受 其 重量 的 第 一 个 盒子 内 (如 果 设 有 盒子 拥有 足够 的 容量 就 开辟 
一 个 新 的 盒子 ) 。( 该 策略 以 及 后 面 所 有 的 策略 都 将 得 出 3 个 盒子 ， 这 不 是 最 优 的 
结果 。) 
b. 把 物品 放 人 有 最 大 容量 的 盒子 内 。 
xxc、， 把 物品 放 人 能 够 容纳 下 它 而 又 不 过 载 的 装填 得 最 满 的 盒子 中 。 
xxd. 这 些 策略 中 有 通过 将 物品 按 重 量 预先 排序 而 功能 得 到 增强 的 吗 ? 
6.35 设 我 们 想 要 将 操作 DecreaseAllKeys(A) 添 加 到 堆 的 指令 系统 中 去 。 该 操作 的 结 
是 堆 中 所 有 的 关键 字 都 将 它们 的 值 减少 和 A。 对 于 你 所 选择 的 堆 的 实现 方法 ,解释 所 
做 的 必要 的 修改 ,使 得 所 有 其 他 操作 都 保持 它们 的 运行 时 间 而 DecreaseAllKeys 
LA. O11) FF 6 
6.36 这 两 个 选择 算法 中 哪个 具有 更 好 的 时 间 界 ? 
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有 操作 均 得 到 最 佳 的 最 坏 情形 界 。 另 外 一 种 有 趣 的 实现 方法 是 配对 堆 (pairing heap)", 
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在 这 一 章 ， 我 们 讨论 数组 元 素 的 排序 问题 。 为 简单 起 见 ， 假 设 在 我 们 的 例子 中 数组 只 
包含 整数 ,虽然 更 复杂 的 结构 显然 也 是 可 能 的 。 对 于 本 章 的 大 部 分 内 容 ， 我 们 还 假设 整个 
排序 工作 能 够 在 主 存 中 完成 ， 因 此 ， 元 素 的 个 数 相 对 来 说 比较 小 (小 于 10")。 当 然 ， 不 能 在 
主 存 中 完成 而 必须 在 磁盘 或 磁带 上 完成 的 排序 也 相当 重要 。 这 种 类 型 的 排序 叫 作 外 部 排序 
(external sorting) ， 将 在 本 章 末 尾 讨 论 外 部 排序 。 

我 们 对 内 部 排序 的 考察 将 指出 : 

e 存在 几 种 容易 的 算法 以 OCN? ) 排 序 ， 如 插入 排序 。 

e 有 一 种 算法 叫 作 和 希 尔 排序 (Shellsort) ， 它 的 编程 非常 简单 ， 以 oCN ) 运行 ， 并 在 实 

践 中 很 有 效 。 

e 有 一 些 稍微 复杂 的 O(N log N) 的 排序 算法 。 

e 任何 通用 的 排序 算法 均 需 要 Q(N log N) 次 比较 。 

本 章 的 其 余部 分 将 描述 和 分 析 各 种 排序 算法 。 这 些 算 法 包含 一 些 有 趣 的 、 重 要 的 代码 
优化 和 算法 设计 思想 。 可 以 对 排序 做 出 精确 的 分 析 。 预 先 说 明 ， 在 适当 的 时 候 ， 我们 将 尽 
可 能 地 多 做 一 些 分 析 。 


7.1 预备 知识 


我 们 描述 的 算法 都 将 是 可 以 互 换 的。 每 个 算法 都 将 接收 一 个 全 有 元 素 的 数组 和 一 个 包 
含 元 素 个 数 的 整数 。 

我 们 将 假设 N 是 传递 到 排序 例 程 中 的 元 素 个 数 ， 它 已 经 被 检查 过 ， 是 合法 的 。 按 照 C 
的 约定 ， 对 于 所 有 的 排序 ， 数 据 都 将 在 位 置 0 处 开始 。 

我 们 还 假设 “二 ”和 “二 ”运算 符 存在 ,它们 可 以 用 于 对 输入 进行 一 致 的 排序 。 除 赋 
值 运算 符 外 ,这 两 种 运算 是 仅 有 的 允许 对 输入 数据 进行 的 操作 。 在 这 些 条 件 下 的 排序 叫 作 
基于 比较 的 排序 (comparison-based sorting) , 


7.2 插入 排序 


21 算法 


最 简单 的 排序 算法 之 一 是 插入 排序 (Cinsertion sort)。 插 入 排序 由 N 一 1 趟 (pass) 排 序 组 
成 。 对 于 P=1 趟 到 P 二 N 一 1 趟 ,插入 排序 保证 从 位 置 0 到 位 置 P 上 的 元 素 为 已 排序 状 
态 。 插 入 排序 利用 了 这 样 的 事实 : 位 置 0 到 位 置 P 一 1 上 的 元 素 是 已 排 过 序 的 。 图 7-1 显示 
一 个 简单 的 数组 在 每 一 趟 插入 排序 后 的 情况 。 

图 7-1 表达 了 一 般 的 方法 。 在 第 P 趟 ,我 们 将 位 置 P 上 的 元 素 向 左 移动 到 它 在 前 P 十 1 个 
元 素 中 的 正确 位 置 上 。 图 7-2 中 的 程序 实现 该 想法 。 第 2 一 5 行 实现 数据 移动 而 没有 明显 使 用 
交换 。 将 位 置 P 上 的 元 素 存 于 tmp 中 ， 而 (在 位 置 已 之 前 ) 所 有 更 大 的 元 素 都 向 右 移动 一 个 位 
置 。 然 后 将 top 置 于 正确 的 位 置 上 。 这 种 方法 与 实现 二 又 堆 时 所 用 到 的 技巧 相同 。 









64 51 21 







初始 
在 p=1l 之 后 | 8 34 64 51 32 2 
ptk | 8 34 64 a 32 21 
在 产 3 之 后 | 8 34 51 64 3 21 
4ep-4Z | 8 32 34 5 64 2 
在 JES 之 后 | 8 20 32 9394 a a 
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图 7-1 每 趟 后 的 插入 排序 





void 
InsertionSort( ElementType A[ ], int N ) 


int j, PF; 


Element Type Tmp; 


g= T7 for( P = 1; P < N; P++ ) 
{ 
/* 2*/ Tmp = AL P ]; 
/* 3*/ forl j = Py j> 0 && wo j-1]» Tmp; j-- ) 
fh a4 AL J eALJ 114 
fp 5*7 AL j ] = Tmp; 











图 7-2 插入 排序 例 程 


7.2.2 插入 排序 的 分 析 


由 手 嵌 套 循环 每 趟 花费 N 次 迭代 ， 因 此 插入 排序 为 O(N?)， 而且 这 个 界 是 精确 的 ， 因 
为 以 反 序 输入 可 以 达到 该 界 。 精 确 计算 指出 对 于 P 的 每 一 个 值 ， 第 4 行 的 测试 最 多 执行 
P 十 1 次 。 对 所 有 的 卫 求 和 ， 得 到 总 数 为 


Micrerteke EN = @(N’) 


一 方面 ， 如 果 输入 数据 已 预先 排序 ， 那 么 运行 时 间 为 OCN)， 因 为 内 层 fox 循环 的 检测 总 
ee, Ae ce eee ee, an 
么 插入 排序 将 运行 得 很 快 。 由 于 这 种 变化 差别 很 大 ， 因 此 值得 我 们 去 分 析 该 算法 平均 情形 的 行 
为 。 实 际 上 ， 和 各 种 其 他 排序 算法 一 样 ， 插 入 排序 的 平均 情形 也 是 @CN )， 详 见 下 节 的 分 析 。 


7.3 一 些 简单 排序 算法 的 下 界 


数字 数组 的 一 个 逆序 (inversion) 是 指数 组 中 具有 i<j HAT?) ALIAS fS ALi], 
ALi])。 在 上 节 的 例子 中 ,输入 数据 34, 8. 64, 51, 32. 214 9 个 逆序 ， 即 (34，8)， 
Gd, 222, E36, ZI, COL, SD, (64, 3), (00, 2109, OL, 1, Gls 21s C32. 215, 
注意 ， 这 正好 是 需要 由 插入 排序 ( 非 直 接 ) 执 行 的 交换 次 数 。 情 况 总 是 这 样 ， 因 为 交换 两 个 
不 按 原 序 排列 的 相 邻 元 素 恰 好 消除 一 个 逆序 ， 而 一 个 排 过 序 的 数组 没有 逆序 。 由 于 算法 中 
还 有 OCN) 项 其 他 的 工作 ， 因 此 插入 排序 的 运行 时 间 是 OCT 十 N)， 其 中 工 为 原始 数组 中 的 逆 
序数 。 于 是 ， 若 道 序数 是 O(N)， 则 插入 排序 以 线性 时 间 运 行 。 
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我 们 可 以 通过 计算 排列 中 的 平均 逆序 数 而 得 出 插入 排序 平均 运行 时 间 的 精确 的 界 。 如 
往常 一 样 ， 定 义 平均 是 一 个 困难 的 命题 。 我 们 将 假设 不 存在 重复 元 素 ( 如 果 人 允许 重复 ， 那 么 
我 们 甚至 连 重 复 的 平均 次 数 究竟 是 什么 都 不 清楚 ) 。 利 用 该 假设 ， 我 们 可 设 输入 数据 是 前 N 
个 整数 的 某 个 排列 (因为 只 有 相对 顺序 才 是 重要 的 )， 并 设 所 有 的 排列 都 是 等 可 能 的 。 在 这 
些 假设 下 ， 我 们 有 如 下 定理 : 

定理 7.1 个 互 异 数 的 数组 的 平均 逆序 数 是 NCN 一 1)/4。 

ER: 对 于 含有 任意 的 数 的 表 工 ， 考 虑 其 反 序 表 L,。 上 例 中 的 反 序 表 是 21，32，51， 
64，8，34。 考 虑 该 表 中 任意 两 个 数 的 序 偶 (z，y)， 且 y>r, WA., Ræ LML, 之 中 的 一 
个 ， 该 序 偶 表 示 一 个 逆序 。 在 表 工 和 它 的 反 序 表 寺 , 中 序 偶 的 总 个 数 为 NCN 一 1)/2。 因 此 ， 
平均 表 有 该 量 的 一 半 ， 即 N(N 一 1)/4 个 逆序 。 

这 个 定理 意味 着 插入 排序 平均 是 二 次 的 ， 同 时 也 提供 了 只 交换 相 邻 元 素 的 任何 算法 的 
一 个 很 强 的 下 界 。 

定理 7.2 通过 交换 相 令 元 素 进 行 排 序 的 任何 算法 平均 需要 QCN?) 时 间 。 

WEBB: 初始 的 平均 逆序 数 是 N(N 一 1)/4 二 QC(N?)， 而 每 次 交换 只 减少 一 个 逆序 ， 因 此 
需要 QUON ) 次 交换 。 

这 是 证 明 下 界 的 一 个 例子 ， 它 不 仅 对 非 显 式 地 实施 相 邻 元 素 的 交换 的 插入 排序 有 效 ， 
而 且 对 诸如 冒 泡 排序 和 选择 排序 等 其 他 一 些 简 单 算法 也 是 有 效 的 ， 不 过 这 些 算法 将 不 在 这 
里 描述 。 事实 上 ， 它 对 一 整 类 只 进行 相 邻 元 素 的 交换 的 排序 算法 (包括 那些 未 被 发 现 的 算 
法 ) 都 是 有 效 的 。 正 因为 如 此 ， 这 个 证 明 在 经 验 上 是 不 能 被 认可 的 。 虽 然 这 个 下 界 的 证 明 非 
常 简 单 ， 但 是 一 般 说 来 证 明 下 界 要 比 证 明 上 界 复杂 得 多 。 

这 个 下 界 告诉 我 们 ， 为 了 使 一 个 排序 算法 以 亚 二 次 (subquadratic) 或 oCN?^) WI [8] is 1. 
必须 执行 一 些 比较 ， 特 别 要 对 相距 较 远 的 元 素 进行 交换 。 一 个 排序 算法 通过 删除 逆序 得 以 
向 前 进行 ， 而 为 了 有 效 地 运行 ， 它 必须 每 次 交换 删除 不 止 一 个 逆序 。 





7.4 RHEE 


希 尔 排序 (Shellsort) 的 名 称 源 于 它 的 发 明 者 Donald Shell， 该 算法 是 冲破 二 次 时 间 屏 障 
的 第 一 批 算 法 之 一 ， 不过， 从 它 的 发 现 之 日 起 ， 又 过 了 若干 年 后 才 证 明了 它 的 亚 二 次 时 间 
界 。 正 如 上 节 所 提 到 的 ， 它 通过 比较 相距 一 定 间隔 的 元 素来 工作 ,各 赵 比 较 所 用 的 距离 随 
着 算法 的 进行 而 减 小 ， 直 到 只 比较 相 邻 元 素 的 最 后 一 趟 排序 为 止 。 由 于 这 个 原因 , 希 尔 排 
序 有 时 也 叫 作 缩小 增 量 排序 (diminishing increment sort), 

希 尔 排 序 使 用 一 个 序列 his hos ts hh,» WY ESS FFF] Cincrement sequence)。 只 要 h =1, 
任何 增 量 序列 都 是 可 行 的 ， 不 过 ， 有 些 增 量 序列 比 另 外 一 些 增 量 序列 更 好 (后 面 我 们 将 讨论 这 个 
问题 )。 在 使 用 增 量 h 的 一 趟 排序 之 后 ， 对 于 每 一 个 i 我 们 有 AD ]ELADi +h, ] GEHE RAR 
的 )， 所 有 相隔 h 的 元 素 都 被 排序 。 此 时 称 文件 是 有 -排序 的 (hi-sorted)。 例 如 ， 图 7-3 显示 了 各 
趟 排序 后 数组 的 情况 。 和 希 尔 排 序 的 一 个 重要 性 质 (我 们 只 叙述 而 不 证 明 ) 是 一 个 -排序 的 文件 (此 
后 将 是 na -排序 的 ) 保 持 它 的 -排序 性 。 事实 上 ， 假如 情况 不 是 这 样 的 话 ， 那 么 该 算法 也 就 


没什么 意义 了 ， 因 为 前 面 各 趟 排序 的 结果 会 被 后 面 各 趟 排序 给 打 乱 。 








初始 | 


si 94 u 96 12 35 4147 95 28 58 4i 75 15 | 





在 全 排序 后 | 35 17 11 28 12 41 75 15 96 S8 81 94 95 
在 3- 排 序 后 | 28 12 11 35 15 41 58 17 94 75 81 96 95 
在 二 排序 后 | 11 12 15 17 28 35 41 58 75 81 94 95 96 














Ac 排序 的 一 般 做 法 是 ， 


7-3 希 尔 排序 每 趟 之 后 的 情况 


ST ho hi 十 1，…，N 一 1 中 的 每 一 个 位 置 i， 把 其 上 的 元 素 
WB i, i 一 及 ，i 一 2h.… 中 间 的 正确 位 置 上 。 虽 然 这 并 不 影响 最 终结 果 ，, 但 是 仔细 的 考察 指 
出 ， 一 趟 hw- 排序 的 作用 就 是 对 hi 个 独立 的 子 数组 执行 一 次 插入 排序 。 当 我 们 分 析 希 尔 排 


序 的 运行 时 间 时 ， 这 个 考察 结果 将 是 很 重要 的 。 


增 量 序列 的 一 种 流行 (但 是 不 好 ) 的 选择 是 使 用 Shell 建议 的 序列 : h, =L N/2 ] 和 ha = 
Lhi /2 LB 7-4 包含 一 个 使 用 该 序列 实现 希 尔 排 序 的 程序 。 后 面 我 们 将 看 到 ， 存 在 一 些 递 
增 的 序列 ， 它 们 对 该 算法 的 运行 时 间 做 出 了 重要 的 改进 ， 即 使 是 一 个 小 的 改变 都 可 能 剧烈 














地 影响 算法 的 性 能 ( 见 练习 7. 10)。 
void 
Shellsort( ElementType A[ ], int N ) 
{ 
int i, j, Increment; 
ElementType Tmp; 
‘ /* 1*/ for( Increment = N / 2; Increment > 0; Increment /= 2 ) 
Je 2*/ for( i = Increment; i « N; i++ ) 
{ 
/* 3*/ Tmp = AL i]; 
/* 4*/ for( j = i; j >= Increment; j -= Increment ) 
p 5r if( Tmp < A[ j - Increment ] ) 
/* 6*/ AC j ] = AL j - Increment ]; 
else 
ft FF break; 
[E B87 AL j ] = Tmp; 
} 
} 
图 7-4 使 用 希 尔 增 量 的 希 尔 排 序 例 程 ( 可 能 有 更 好 的 增 量 ) 


图 7-4 中 的 程序 以 与 我 们 在 插入 排序 实现 方法 中 相同 的 方式 避免 明显 地 使 用 交换 。 


希 尔 排序 的 最 坏 情 形 分析 


虽然 希 尔 排序 编程 简单 ， 但 是 ， 其 运行 时 间 的 分 析 则 完全 是 另外 一 回 事 。 和 希 尔 排序 的 
运行 时 间 依 赖 于 增 量 序列 的 选择 ， 而 证 明 可 能 相当 复杂 。 和 希 尔 排序 的 平均 情形 分 析 ， 除 最 
平凡 的 一 些 增 量 序列 外 ， 是 一 个 长 期 未 解决 的 问题 。 我 们 将 证 明 在 两 个 特别 的 增 量 序列 下 


最 坏 情 形 的 精确 的 界 。 


定理 7.3 使 用 希 尔 增 量 时 和 希 尔 排序 的 最 坏 情形 运行 时 间 为 ON’). 


证 明 : 证 明 不 仅 需要 指出 最 坏 情形 和 运行 时 间 的 上 界 ， 而 且 还 需要 指出 存在 某 个 输入 实 
际 上 就 花费 QCN?) 时 间 运 行 。 首 先 通过 构造 一 个 坏 情形 来 证 明 下 界 。 我 们 先 选择 N 是 2 的 
宕 。 这 使 得 除 最 后 一 个 增 量 是 1 外 所 有 的 增 量 都 是 偶数 。 现 在 ， 我 们 给 出 一 个 数组 Input- 
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Data 作为 输入 ， 它 的 偶数 位 置 上 有 N/2 个 同 为 最 大 的 数 ， 而 在 奇数 位 置 上 有 N/2 个 同 为 
最 小 的 数 ( 对 该 证 明 ， 第 一 个 位 置 是 位 置 1) 。 由 于 除 最 后 一 个 增 量 外 所 有 的 增 量 都 是 偶数 ， 
因此 ， 当 我 们 进行 最 后 一 趟 排序 前 ，NV/2 个 最 大 的 元 素 仍 然 处 在 偶数 位 置 上 ， 而 N/2 个 最 
小 的 元 素 也 还 是 在 奇数 位 置 上 。 于 是 ,在 最 后 一 趟 排序 开始 之 前 第 i 个 最 小 的 数 (i<N/2) 
在 位 置 2 一 1 上 。 将 第 i 个 元 素 恢 复 到 其 正确 位 置 需要 在 数组 中 移动 i 一 1 个 间隔 。 这 样 ， 


仅仅 将 N/2 个 最 小 的 元 素 放 到 正确 的 位 置 上 就 至 少 需要 3》)i 一 1 = QUND 的 工作 。 举 一 个 


例子 ， 图 7-5 显示 一 个 N=16 时 的 坏 ( 但 不 是 最 坏 ) 的 输入 。 在 2- 排 序 后 的 逆序 数 一 直 恰好 
保持 为 1 十 2 十 3 十 4 十 5 十 6 十 7 二 28， 因 此 ， 最 后 一 趟 排序 将 花费 相当 多 的 时 间 。 

现在 我 们 证 明 上 界 O(N’ ) 以 结束 本 证 明 。 前 面 已 经 观察 到 ， 带 有 增 量 hi 的 一 趟 排序 由 
hi 个 关于 N/h, 个 元 素 的 插入 排序 组 成 。 由 于 插入 排序 是 二 次 的 ， 因 此 一 趟 排序 总 的 开销 


是 O(N/h)*) 二 OCN?/hs)。 对 所 有 各 趟 排序 求 和 则 给 出 总 的 界 为 O( >) N?/h,)= 
O(N? >)1/ 访 )。 因 为 这 些 增 量 形成 一 个 几何 级 数 ， 其 公 比 为 2， 而 该 级 数 中 的 最 大 项 是 


h=1, Bb. 21/h < 2。 于 是 ,我 们 得 到 总 的 界 OCN?)。 
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图 7-5 具有 希 尔 增 量 的 希 尔 排序 的 坏 情 形 (位 置 编号 从 1 到 16) 


希 尔 增 量 的 问题 在 于 ， 这 些 增 量 对 未 必 互 素 ， 因 此 较 小 的 增 量 可 能 影响 很 小 。Hibbard 提 
出 一 个 稍微 不 同 的 增 量 序列 ， 它 在 实践 中 (并 且 理 论 上 ) 给 出 更 好 的 结果 。 他 的 增 量 形 如 1，3， 
7，…，2’ 一 ]。 虽 然 这 些 增 量 几乎 是 相同 的 ， 但 关键 的 区 别 是 相 邻 的 增 量 没有 公 因 子 。 现 在 我 
们 就 来 分 析 使 用 这 个 增 量 序列 的 希 尔 排 序 的 最 坏 情 形 运行 时 间 ， 这 个 证 明 相当 复杂 。 

定理 7.4 使 用 Hibbard 增 量 的 希 尔 排 序 的 最 坏 情形 运行 时 间 为 OC€N?7), 

WEBB: 我 们 只 证 明 上 界 而 将 下 界 的 证 明 留 作 练 习 。 这 个 证 明 需 要 堆 垒 数论 (additive 
number theory) 中 某 些 众所周知 的 结果 。 本 章 末 提供 了 这 些 结果 的 参考 资料 。 

和 前 面 一 样 ， 对 于 上 界 ， 我 们 还 是 计算 每 一 趟 排序 的 运行 时 间 的 界 ， 然 后 对 各 趟 求 和 。 
对 于 那些 尺 之 N “的 增 量 ， 我 们 将 使 用 前 一 定理 得 到 的 界 OCN/ 乱 )。 虽 然 这 个 界 对 于 其 他 
增 量 也 是 成 立 的 ,但 是 它 太 大 ， 用 不 上 。 直 观 地 看 ,我 们 必须 利用 这 个 增 量 序列 是 特殊 的 
这 样 一 个 事实 。 我 们 需要 证 明 的 是 ， 对 于 位 置 已 上 的 任意 元 素 A"， 当 要 执行 hs- 排 序 时 ， 
只 有 少数 元 素 在 位 置 P 的 左边 且 大 于 A,。 

当 对 输入 数组 进行 h- 排 序 时 ,我 们 知道 它 已 经 是 ha HEF A her- HEF RIT o HE hr 
排序 以 前 ， 考 虑 位 置 P 和 P 一 i 上 的 两 个 元 素 ， 其 中 i 二 P。 如 果 i 是 hi 或 有 1;; 的 倍数 ， 那 
么 显然 ALP 一 司 二 ALP]。 不 仅 如 此 ， 如 果 i 可 以 表示 为 hi! 和 hj; 的 线性 组 合 ( 以 非 负 整数 


的 形式 )， 那 么 也 有 ALP 一 i 二 ALPj]。 例 如 ， 当 我 们 进行 3- 排 序 时 ， 文 件 已 经 是 7- 排序 和 
15- 排 序 的 了 。52 可 以 表示 为 7 和 15 的 线性 组 合 : 52 二 1X7 十 3X15。 因 此 ，AL100j] 不 可 能 
大 于 A[152], WA AL100]<A[107]<A[122]<A[137]<A[152], 

现在 ， his; 72h41, 因此 hes 和 hr HAAAT. 在 这 种 情形 下 ， 可 以 证 明 ， 至 少 
Fl Che) D Gus; — 1) — 8h,7 Ah, 一 样 大 的 所 有 整数 都 可 以 表示 为 hil 和 hi;;, 的 线性 组 合 
( 见 本 童 末尾 的 参考 文献 )。 

这 就 告诉 我 们 ,第 4 行 的 for 循环 体 对 于 这 些 N 一 h 位 置 上 的 每 一 个 ， 最 多 执行 
8hi 十 4 二 O(h) 次 。 于 是 我 们 得 到 每 趟 的 界 OCNh,)。 

利用 大 约 一 半 的 增 量 满足 h. 二 VN 的 事实 并 假设 t 是 偶数 ， 那 么 总 的 运行 时 间 为 

OU S Nh, + 2: N /h,) = O(N Vh, +N? Y! L/h, ) 
因为 两 个 和 都 是 几何 级 数 ， 并 且 Au; —90/ ND. AEREA 
N* 3/2 
= OCGNh gs) +0(; -)= OCN? y 


使 用 Hibbard 增 量 的 希 尔 排序 平均 情形 运行 时 间 基 于 模拟 的 结果 被 认为 是 OCN””), fH 
是 没有 人 能 够 证 明 该 结果 。Pratt 已 经 证 明 ，O@(N””) 的 界 适用 于 广泛 的 增 量 序列 。 

Sedgewick 提出 了 几 种 增 量 序列 ， 其 最 坏 情 形 运 行 时 间 ( 也 是 可 以 达到 的 ) 为 O(N" )。 
对 于 这 些 增 量 序列 的 平均 运行 时 间 猿 测 为 O(N”'”“)。 经 验 研究 指出 ， 在 实践 中 这 些 序 列 的 运 
行 要 比 Hibbard 的 好 得 多 ， 其 中 最 好 的 是 序列 {1，5，19， 41，109，…}， 该 序列 中 的 项 或 
者 是 9 .4 一 9。2 十 1， 或 者 是 汪 一 3。2 十 1。 通 过 将 这 些 值 放 到 一 个 数组 中 可 以 最 容易 地 
实现 该 算法 。 虽 然 有 可 能 存在 某 个 增 量 序列 使 得 能 够 对 希 尔 排序 的 运行 时 间 做 出 重大 改进 ， 
但 是 ， 这 个 增 量 在 实践 中 还 是 最 为 人 们 称道 的 。 

关于 希 尔 排序 还 有 几 个 其 他 结果 ,它们 需要 数论 和 组 合 数学 中 一 些 艰 深 的 定理 而 且 主 
要 是 在 理论 上 有 用 。 希 尔 排 序 是 算法 非常 简单 又 具有 极其 复杂 的 分 析 的 一 个 好 例子 。 

硕 尔 排序 的 性 能 在 实践 中 是 完全 可 以 接受 的 ， 即 使 是 对 于 数 以 万 计 的 N 仍 是 如 此 。 编 
程 的 简单 特点 使 得 它 成 为 对 较 大 的 输入 数据 经 常 选用 的 算法 。 


7.5 HEHE 


正如 第 6 章 提 到 的 ， 优 先 队 列 可 以 用 于 花费 OCN log N) 时 间 的 排序 。 基 于 该 想法 的 算 
法 叫 作 堆 排 序 (heapsort)， 它 给 出 我 们 至 今 所 见 到 的 最 佳 的 大 O 运行 时 间 。 然 而 ， 在 实践 
中 它 却 慢 于 使 用 Sedgewick 增 量 序列 的 希 尔 排序 。 

回忆 在 第 6 章 建立 N 个 元 素 的 二 叉 堆 的 基本 方法 ， 此 时 花费 O(N) 时 间 。 然 后 我 们 执 
ÍT N 次 DeleteMin 操作 。 按 照 顺 序 ， 最 小 的 元 素 先 离开 该 堆 。 通 过 将 这 些 元 素 记 录 到 第 
二 个 数组 然后 再 将 数组 拷贝 回来 ， 我们 得 到 N 个 元 素 的 排序 。 由 于 每 个 DeleteMin 花费 
O(log N) 时 间 ， 因 此 总 的 运行 时 间 是 O(N log ND. 

该 算法 的 主要 问题 在 于 它 使 用 了 一 个 附加 的 数组 。 因 此 ， 存 储 需 求 增加 一 倍 。 在 某 些 
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实例 中 这 可 能 是 个 问题 。 注 意 ,将 第 二 个 数组 拷贝 回 第 一 个 数组 的 额外 时 间 消 耗 只 是 
O(N)， 这 不 可 能 显著 影响 运行 时 间 。 这 个 问题 是 空间 的 问题 。 

避免 使 用 第 二 个 数组 的 聪明 做 法 是 利用 这 样 的 事实 : 在 每 次 DeleteMin 之 后 ， 堆 缩小 
了 1。 因 此 ， 位 于 堆 中 最 后 的 单元 可 以 用 来 存放 刚刚 删 去 的 元 素 。 例 如 ， 设 我 们 有 一 个 堆 ， 
它 含 有 6 个 元 素 。 第 一 次 DeleteMin 产生 A, 。 现 在 该 堆 只 有 5 个 元 素 ， 因 此 我 们 可 以 把 
A, 放 在 位 置 6 上 。 下 一 次 DeleteMin 产生 A, ， 由 于 该 堆 现在 只 有 4 个 元 素 ， 因 此 我 们 把 
A, 放 在 位 置 5 上 。 

使 用 这 种 策略 ， 在 最 后 一 次 DeleteMin 后 ， 该 数组 将 以 递减 的 顺序 包含 这 些 元 素 。 如 
果 想 要 这 些 元 素 排 成 更 典型 的 递增 顺序 ， 那 么 可 以 改变 序 的 特性 使 得 父亲 的 关键 字 的 值 大 
于 儿子 的 关键 字 的 值 。 这 样 就 得 到 max HE, 

我 们 在 实现 中 将 使 用 一 个 max 堆 ， 但 由 于 速度 的 原因 避免 了 实际 的 ADT。 照 通常 的 习 
惯 ， 每 一 件 事 都 是 在 数组 中 完成 的 。 第 一 步 以 线性 时 间 建 立 一 个 堆 。 然 后 通过 将 堆 中 的 最 
后 元 素 与 第 一 个 元 素 交 换 ， 缩 减 堆 的 大 小 并 进行 下 滤 ， 来 执行 N 一 1 次 DeleteMax RE. 
当 算 法 终止 时 ， 数 组 则 以 所 排 的 顺序 包含 这 些 元 素 。 人 例如， 考虑 输入 序列 31，41，59，26， 
53，58，97。 所 得 到 的 堆 如 图 7-6 所 示 。 

Al 7-7 显示 了 第 一 次 DeleteMax 之 后 的 堆 。 从 图 中 看 出 ， 堆 中 的 最 后 元 素 是 31， 堆 数 
组 中 放置 97 的 那 一 部 分 从 技术 上 说 已 不 再 属于 该 堆 。 在 此 后 的 5 次 DeleteMax 操作 之 后 ， 
该 堆 实 际 上 只 有 一 个 元 素 ， 而 在 堆 数组 中 留 下 的 元 素 呈 现 出 的 将 是 排序 后 的 顺序 。 
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图 7-6 BuildHeap 阶段 以 后 的 Max Ht 图 7-7 第 一 次 DeleteMax 后 的 堆 


执行 堆 排序 的 代码 在 图 7-8 中 给 出 。 稍 微 复 杂 的 是 ， 不 像 二 叉 堆 ， 当 时 数据 是 在 数组 
下 标 1 处 开始 ， 而 此 处 堆 排 序 的 数组 包含 位 置 0 处 的 数据 。 因 此 ， 这 时 的 程序 与 二 叉 堆 的 
代码 有 些 不 同 ， 不 过 变化 很 小 。 


HEHE Fe AS 33 tT 

我 们 在 第 6 章 看 到 ， 第 一 阶段 构建 堆 最 多 用 到 2N 次 比较 。 在 第 二 阶段 , 第 i 次 
DeleteMax 最 多 用 到 2| log zj 次 比较 ， 总 数 最 多 为 2N log N 一 O(N) 次 比较 ( 设 N22). 
因此 ， 在 最 坏 的 情形 下 ， 堆 排序 最 多 使 用 2N log N 一 OCN) 次 比较 。 练 习 7. 12b 让 你 证 明 
对 于 所 有 的 DeleteMax 操作 ， 有 可 能 同时 达到 它们 的 最 坏 情 形 。 





#define Leftchild( i) (2* (i)+1) 


void 
PercDown( ElementType AL ], int i, int N ) 


int Child; 
ElementType Tmp; 
pr Ley for( Tmp = AL i ]; LeftChild( i ) < N; i = Child ) 
{ 
pA 247 Child = LeftChild( i ); 
g* Sty ifC Child != N - 1 && A[ Child + 1 ] > A[ Child ] ) 
J" 4*/ Child++; 
/* 55/ ifC Tmp < AL Child ] ) 
f= OY AL i ] = AL Child J; 
else 
/* 7*/ break; 
} 
/* 8*7 AL i ] = Tmp; 
} 
void 


Heapsort( ElementType A[ ], int N ) 
{ 








int i; 
/* 1*/ for( i = N/2; i >= 0; i-- ) /* BuildHeap */ 
/* 2*/ PercDown( A, i, N ); 
/* 3*/ for(i-N-1;i»90; i-- ) 

{ 
/* 4*/ Swap( &A[ 0 ], &A[ i ] ); /* DeleteMax */ 
/* 5*/ PercDown( A, 0, i ); 

} 

} 
图 7-8 EHE 


经 验 指出 ， 堆 排序 是 一 个 非常 稳定 的 算法 它 平均 使 用 的 比较 只 比 最 坏 情形 界 指出 的 
略 少 。 然 而 直到 最 近 ， 还 没有 人 能 够 指出 堆 排 序 平均 运行 时 间 的 非 平凡 界 。 似 乎 问题 在 于 
连续 的 DeleteMax 操作 破坏 了 堆 的 随机 性 ， 使 得 概率 论证 非常 复杂 。 最 近 ， 另 一 种 处 理 方 
法 被 证 明 是 成 功 的 。 

定理 7.5 对 NN 个 互 异 项 的 随机 排列 进行 堆 排 序 ， 所 用 的 平均 比较 次 数 为 2N log N— 
O(N log log N). 

证 明 : 构建 堆 的 阶段 平均 使 用 BCN) 次 比较 ， 因 此 我 们 只 需要 证 明 第 二 阶段 的 界 。 设 一 
个 排列 为 {1s 2, 9. NJ). 

设 第 i 次 DeleteMax 将 根 元 素 向 下 推 了 d; 层 。 此 时 它 使 用 了 2d; 次 比较 。 对 于 含有 任 
意 输 入 数据 的 堆 排 序 ， 存 在 一 个 开销 序列 (cost sequence) D: dis dz, c. ds. CHE TB 


二 阶段 的 开销 ， 该 开销 由 Mb = S di 给 出 ， 因 此 所 使 用 的 比较 次 数 是 2M 。 

^ F(CN) 是 含有 N 项 的 堆 的 个 数 。 可 以 证 明 ( 练 习 7.42), fONDON/(OI)OP, Rm, 
e=2. 718 28…。 我 们 将 证 明 ， 只 有 这 些 堆 中 指数 上 很 小 的 部 分 (特别 是 (N/16)" ) 的 开销 小 
于 M=N(log N 一 log log N 一 4) 。 当 该 结论 得 证 时 可 以 推出 ，Mop 的 平均 值 至 少 是 M 减 去 


大 小 为 o(1) 的 一 项 ， 这 样 ， 比 较 的 平均 次 数 至 少 是 2M。 因 此 ， 我 们 的 基本 目标 是 证 明 存在 
很 少 的 具有 小 的 开销 序列 的 堆 。 
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因为 第 d, 层 上 最 多 有 2“ 个 节点 ， 所 以 对 于 任意 的 d;， 存 在 根 元 素 可 能 到 达 的 2^ 个 位 

置 。 于 是 ， 对 任意 的 序列 D， 对 应 DeleteMax 的 互 异 序列 的 个 数 最 多 是 
Ss = 24) 945 ...24N 
简单 的 代数 处 理 指出 ， 对 一 个 给 定 的 序列 D: 
Sp = 2" 

因为 每 个 d; 可 取 1 和 | log NI 之 间 的 任意 值 ， 所 以 最 多 存在 (log NOU 个 可 能 的 序列 
D。 由 此 可 知 ， 需 要 花费 的 开销 恰好 为 M 的 互 异 DeleteMax 序列 的 个 数 ， 最 多 是 总 开销 
H M 的 开销 序列 的 个 数 乘 以 每 个 这 种 开销 序列 的 DeleteMax 序列 的 个 数 。 这 样 就 立刻 得 
S Cog N)*2™., 

开销 序列 小 于 M 的 堆 的 总 数 最 多 为 

Sng NI" 2! « Clog IN)^2M 

如 果 我 们 选择 M= N (log N—log log N 一 4)， 那 么 开销 序列 小 于 M 的 堆 的 个 数 最 多 为 
(N/16)™ ,根据 前 面 的 评述 ， 定 理 得 证 。 

通过 更 复杂 的 论述 ， 可 以 证 明 ， 堆 排序 总 是 使 用 至 少 N log N 一 O(N) 次 比较 ,而 且 存 
在 输入 数据 能 够 达到 这 个 界 。 似 乎 平均 情形 也 应 该 是 2N log N 一 OCN) 次 比较 (而 不 是 定理 
7.5 中 更 线性 化 的 第 二 项 )， 这 是 否 能 够 证 明 ( 甚 至 是 否 成 立 ) 还 是 个 未 解决 的 问题 。 





7.6 归并 排序 


现在 我 们 把 注意 力 转 到 归并 排序 (mergesort)。 归 并 排序 以 OON log N) 最 坏 情 形 运行 时 
间 运 行 ， 而 所 使 用 的 比较 次 数 几 乎 是 最 优 的 。 它 是 递归 算法 一 个 很 好 的 实例 。 

这 个 算法 中 基本 的 操作 是 合并 两 个 已 排序 的 表 。 因 为 这 两 个 表 是 已 排序 的 ， 所 以 若 将 
输出 放 到 第 三 个 表 中 ， 则 该 算法 可 以 通过 对 输入 数据 一 趟 排序 来 完成 。 基 本 的 合并 算法 是 
取 两 个 输入 数组 A 和 已 ， 一 个 输出 数组 C， 以 及 三 个 计数 器 Aptr、Bptr、Cptr， 它 们 初始 
置 于 对 应 数组 的 开始 端 。ALAptr] 和 BLBptrj 中 的 较 小 者 被 拷贝 到 C 中 的 下 一 个 位 置 ， 相 关 
的 计数 器 向 前 推进 一 步 。 当 两 个 输入 表 有 一 个 用 完 的 时 候 ， 则 将 另 一 个 表 中 的 剩余 部 分 拷 
jsp C 中 。 合 并 例 程 工作 的 例子 见 下 面 各 图 。 










































































is es ETSE | 
"A nd Cptr 
如 果 数 组 和 A 含有 1、13、24、26,， 数组 B 含 有 2、15、27、38， 那 么 该 算法 如 下 执行 ;: 
首先 ， 比 较 在 1 和 2 之 间 进 行 ， 将 1 添加 到 C 中 ， 然 后 比较 13 和 2。 
1 E aM [26 | |2 15 |27 [38 | | 2 | | | 
ia T e 1 
Aptr Bptr Cptr 


将 2 添加 到 C 中 ， 然 后 比较 13 和 15。 
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Aptr Bptr Cptr 
将 13 添加 到 C 中 ， 接 下 来 比较 24 和 15， 这 样 一直 进 行 到 对 26 和 27 进行 比较 。 
1 | 1% | 24 | 26 2 | 15] 27] 38 i| lis 3 
1 ji T 
Aptr Bptr Cptr 
1 113 | 24 | 26 2 | 15] 27| 38 RESELL 
T f ] 
Aptr Bptr Cptr 
1 [13 | 24| 26 2 | 15] 27] 38 1 | 2] 13/15 | 24 | 
T ij 1 
Aptr Bptr Cptr 


将 26 添加 到 C 中， 数组 A 已 经 用 完 。 
























































{ 1] 13] 24] 26] [2] 15] 27] 38] | :| 2] 13] 1s] 24] 26] | 
ji 
Aptr Bptr Cptr 
将 数组 B 的 其 余部 分 拷贝 到 C 中 。 
1 [13|24|26| | 2 | 15 27| 38 1 | 2 | 13] 15[ 24] 26 | 27] 38] 
Aptr Bptr Cptr 


合并 两 个 已 排序 的 表 的 时 间 显然 是 线性 的 ， 因 为 最 多 进行 了 N 一 1 次 比较 ， 其 中 N 是 
元 素 的 总 数 。 为 了 看 清 这 一 点 ， 注 意 每 次 比较 都 是 把 一 个 元 素 加 到 C 中 ,但 最 后 的 比较 例 
外 ( 它 至 少 添加 两 个 元 素 ) 。 

因此 ， 归 并 排序 算法 很 容易 描述 。 如 果 N=1, 那么 只 有 一 个 元 素 需 要 排序 ， 答 案 是 显 
然 的 。 和 否则 ， 递 归 地 将 前 半 部 分 数据 和 后 半 部 分 数据 各 自 归 并 排序 ， 得 到 排序 后 的 两 部 分 
数据 ， 然 后 使 用 上 面 描述 的 合并 算法 再 将 这 两 部 分 合并 到 一 起 。 例 如 ， 和 欲 将 八 元 素数 组 24, 
13, 26, 1, 2, 27, 38. 15 排序 ， 我 们 递归 地 将 前 四 个 数据 和 后 四 个 数据 分 别 排序 ， 得 到 
1，13，24，26，2，15，27，38。 然 后 ， 将 这 两 部 分 合并 。 最 后 得 到 1，2，13，15，24， 
26，27，38。 该 算法 是 经 典 的 分 治 (Cdivide-and-conquer) 策 略 ， 它 将 问题 分 成 一 些小 的 问题 

aac 而 治 的 阶段 则 将 分 的 阶段 解 得 的 各 个 答案 修补 到 一 起 。 分 治 是 递归 非常 有 
力 的 用 法 ， 我 们 将 会 多 次 遇 到 。 

归并 排序 的 一 种 实现 方法 在 图 7-9 中 给 出 。 这 个 称 为 Mergesort 的 过 程 正 是 递归 例 程 
MSort 的 一 个 驱动 程序 。 

Merge 例 程 是 精妙 的 。 如 果 对 Merge dala 个 临时 数组 ， 那 么 
在 任意 时 刻 就 可 能 有 log N 个 临时 数组 处 于 活动 期 ， 这 对 于 小 内 存 的 机 器 是 致命 的 。 男 一 
方面 ， 如 果 Merge 例 程 动态 分 配 并 释放 最 小 量 临 时 内 存 ， 那 么 由 malloc 占用 的 时 间 会 很 
多 。 严 密 测试 指出 ， 由 于 Merge 位 于 MSort 的 最 后 一 行 ， 因 此 在 任意 时 刻 只 需要 一 个 临时 
PS 而 且 可 以 使 用 该 临时 数组 的 任意 部 分 。 我 们 将 使 用 与 输入 数组 A 相同 的 部 分 ， 

这 就 达到 本 节 末 尾 描述 的 改进 。 图 7-10 实现 了 这 个 Merge 例 程 。 
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void 

MSort( ElementType A[ ], ElementType TmpArray[ ], 
int Left, int Right ) 

{ 


int Center; 


if( Left < Right ) 
{ 
Center = ( Left + Right ) / 2; 
MSort( A, TmpArray, Left, Center ); 
MSort( A, TmpArray, Center + 1, Right ); 
Merge( A, TmpArray, Left, Center + 1, Right ); 


) 


void 

Mergesort( ElementType A[ ], int N ) 

| 
ElementType *TmpArray; 


TmpArray = malloc( N * sizeof( ElementType ) ); 
if( TmpArray != NULL ) 
{ 
MSort( A, TmpArray, 0, N- 1); 
free( TmpArray ); 
} 
else 
FatalError( "No space for tmp array!!!" ); 








{ 





归并 排序 的 分 析 


图 7-9 归并 排序 例 程 


/* Lpos = start of left half, Rpos = start of right half */ 


void 
Merge( ElementType A[ ], ElementType TmpArray[ ], 


int Lpos, int Rpos, int RightEnd ) 
int i, LeftEnd, NumElements, TmpPos; 


LeftEnd - Rpos - 1; 
TmpPos - Lpos; 
NumElements = RightEnd - Lpos + 1; 


/* main loop */ 
while( Lpos «- LeftEnd && Rpos «- RightEnd ) 
ifC AL Lpos ] <= A[ Rpos ] ) 
TmpArray[ TmpPos++ ] = A[ Lpos++ ]; 
else 
TmpArray[ TmpPos++ ] = A[ Rpos++ J; 


while( Lpos <= LeftEnd ) /* Copy rest of first half */ 
TmpArray[ TmpPos++ ] = A[ Lpos++ ]; 

while( Rpos <= RightEnd ) /* Copy rest of second half */ 
TmpArray[ TmpPos++ ] = A[ Rpos++ ]; 


/* Copy TmpArray back */ 
for( i = 0; i « NumElements; i++, RightEnd-- ) 
AL RightEnd ] = TmpArray[ RightEnd ]; 





图 7-10 Merge 例 程 


归并 排序 是 用 于 分 析 递 归 例 程 方法 的 经 典 实例 : 必须 给 运行 时 间 写 





出 一 


=F 3 HX. 


假设 N 是 2 ARE. MARATE DORE E a CB oP. F N= 1. JASE HEE Br 
用 时 间 是 常数 ,我 们 将 记 为 1。 否则 ， 对 NN 个 数 归 并 排序 的 用 时 等 于 完成 两 个 大 小 为 N/2 
的 递归 排序 所 用 的 时 间 再 加 上 合并 的 时 间 ， 它 是 线性 的 。 下 述 方程 给 出 准确 的 表示 : 
T(1)= 1 
T(N)= 2TCN/2) +N 
这 是 一 个 标准 的 递归 关系 ， 它 可 以 用 多 种 方法 求解 。 我 们 将 介绍 两 种 方法 。 第 一 种 方法 是 
H N 去 除 递 归 关 系 的 两 边 ， 你 很 快 就 会 发 现 这 么 做 的 理由 。 相 除 后 得 到 


T(N) _ T(N/2) 
N |  N/2 s 


该 方程 对 任意 的 NCH 2 的 寡 ) 都 是 成 立 的 ， 我 们 还 可 以 写成 
T(N/2) _ TNA 











N/2 N/A "1 
All 
T(N/4)_ TON/8) |} 
N/A N/8 
T2) TQ) 
E co M 


将 所 有 这 些 方程 相 加 ， 也 就 是 说 ， 将 等 号 左边 的 所 有 各 项 相 加 并 使 结果 等 于 右边 所 有 各 项 
的 和 。 项 TCN/2)/(N/2) 出 现在 等 号 两 边 ， 可 以 消去 。 事 实 上 ， 出 现在 两 边 的 项 均 被 消去 ， 
我 们 称 之 为 登 缩 (telescoping) 求 和 。 在 所 有 的 加 法 完成 之 后 ， 最 后 的 结果 为 


ECN): _. TCV) 
e tpe 十 log N 


这 是 因为 所 有 其 余 的 项 都 被 消去 了 而 方程 的 个 数 是 log N 个 ， 故 而 将 各 方程 末尾 的 1 相 加 
起 来 得 到 log N。 再 将 两 边 同 乘 以 N， 我 们 得 到 最 后 的 答案 
T(N) =NlogN+N=OCNlog N) 

TERR. (BMG AT ER EAT 1 EAS R38 ER VAN «EZ PE a EAR RT RE ER AR. E 
为 什么 要 通 除 以 N 

男 一 种 方法 是 在 右边 连续 地 代入 递归 关系 。 我 们 得 到 

T(N) = 2T(N/2)+N 
由 于 可 以 将 N/2 代入 上 面 的 方程 中 
2T(N/2) = 2(2(T(N/4)) + N/2) = 4T(N/4) +N 





因此 得 到 
T(N) = 4T(N/4) +2N 
再 将 N/4 代入 上 面 的 等 式 中 ， 我 们 看 到 
AT(N/4) = 4(2T(N/8)) + N/4) = 8T(N/8) +N 
因此 有 
T(N) = 8T(N/8) +3N 
按 这 种 方式 继续 下 去 ， 得 到 
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T(N) = 2'T(N/2') +k.» N 
利用 k=log N， 我 们 得 到 
T(N) = NT(1)+N log N= N log N-- N 

选择 使 用 哪 种 方法 是 风格 问题 。 第 一 种 方法 偏重 于 一 些 琐碎 的 工作 ， 把 它 写 到 一 张 标 
准 的 8X11 的 纸 上 可 能 更 好 ， 这 样 会 少 出 些 数学 错误 ， 不 过 需要 用 到 一 定 的 经 验 。 第 二 
种 方法 更 偏重 于 使 用 蛮 力 进行 计算 ，。 

回忆 我 们 已 经 假设 NN 三 2。 分析 可 以 更 加 精细 以 处 理 N 不 是 2 的 客 的 情形 (通常 出 现 的 
就 是 这 样 的 情形 )。 事 实 上 ,答案 几 乎 是 一 样 的 。 

虽然 归并 排序 的 运行 时 间 是 O(N log ND. 但 是 它 很 难 用 于 主 存 排序 ， 主 要 问题 在 于 合并 
两 个 排序 的 表 需 要 线性 附加 内 存 ， 在 整个 算法 中 还 at 
这 样 一 些 附加 的 工作 ， 其 结果 是 严重 放 慢 了 排序 的 速度 。 这 种 拷贝 可 以 通过 在 递归 交替 层次 
时 审慎 地 转换 A 和 TmpArray 的 角色 来 得 到 避免 。 归 并 排序 的 一 种 变形 也 可 以 非 递归 地 实现 
( 见 练习 7. 14) ， 但 即使 这 样 ， 对 于 重要 的 内 部 排序 应 用 而 言 ， 人 们 还 是 选择 快速 排序 ， 我 们 将 
在 下 一 节 描 述 这 种 算法 。 不 过 ， 本 章 稍 后 就 会 看 到 ， 合 并 例 程 是 大 多 数 外 部 排序 算法 的 基石 。 


7.7 快速 排序 


顾名思义 ， 快 速 排序 (quicksort) 是 在 实践 中 最 快 的 已 知 排序 算法 ， 它 的 平均 运行 时 间 
是 O(N log N)。 该 算法 之 所 以 特别 快 ， 主 要 是 由 于 非常 精练 且 高 度 优化 的 内 部 循环 。 它 的 
最 坏 情 形 的 性 能 为 OCN’), 但 稍 加 努力 就 可 避免 这 种 情形 。 虽 然 多 年 来 快速 排序 算法 被 认 
为 是 理论 上 高 度 优化 而 在 实践 中 却 不 可 能 正确 编程 的 一 种 算法 ,但 是 如 今 该 算法 简单 易 懂 
而 且 不 难 证明 。 像 归并 排序 一 样 ， 快 速 排序 也 是 一 种 分 治 的 递归 算法 。 将 数组 S 排序 的 基 
本 算法 由 下 列 简单 的 四 步 组 成 ， 

l. WR S 中 元 素 个 数 是 0 或 1， 则 返回 。 

2. 取 S 中 任意 元 素 w， 称 之 为 枢纽 元 (pivot) 。 

3. 将 S— (0) CS 中 其 余 元 素 ) 分 成 两 个 不 相交 的 集合 : Si — (0€ S—- (v) | co) Al S= 
{ZOOS tw laf. 

4. 返回 {quicksort(Si) 后 ， 继 而 v， 继 而 quicksort(S,)})。 

由 于 对 那些 等 于 枢纽 元 的 元 素 的 处 理 ， 第 3 步 分 割 的 描述 不 是 唯一 的 ， 因 此 这 就 成 了 
一 个 设计 上 的 决策 。 一 部 分 好 的 实现 方法 是 将 这 种 情形 尽 可 能 有 效 地 处 理 。 直 观 地 看 ,我 
们 希望 把 等 于 枢纽 元 的 大 约 一 半 的 关键 字 分 到 S, 中 ， 而 另外 的 一 半分 到 S. 中 ， 很 像 我 们 
希望 二 又 查 找 树 保持 平衡 一 样 。 

图 7-11 解释 快速 排序 对 一 个 数 集 的 做 法 。 这 里 的 枢纽 元 (随机 地 ) 选 为 65， 集合 中 其 余 
元 素 分 成 两 个 更 小 的 集合 。 Rd PER gs 13, 26, 31, 43, 57 GÉ 
归 法 则 3) ， 较 大 的 数 的 集合 类 似 处 理 ， 此 时 整个 集合 的 排序 很 容易 得 到 。 

应 该 清楚 该 算法 是 成 立 的 , 但 是 不 清楚 的 是 为 什么 它 比 归并 排序 快 。 如 同 归 并 排序 那 


样 ， 快 速 排序 递归 地 解决 两 个 子 问题 并 需要 线性 的 附加 工作 (第 3 步 ), 不 过 ,与 归并 排序 
不 同 ， 这 两 个 子 问题 并 不 保证 具有 相等 的 大 小 ， 这 是 个 潜在 的 隐患 。 快 速 排序 更 快 的 原因 
TET. 第 3 步 的 分 割 实际 上 是 在 适当 的 位 置 进行 并 且 非 常 有 效 ， 它 的 高 效 大 大 弥补 了 大 小 
不 等 的 递归 调用 的 缺憾 。 





选 枢纽 元 
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对 小 者 的 快速 排序 对 大 者 的 快速 排序 
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0 13 26 31 43: 57 65; 7 91 9? 


图 7-11 说 明快 速 排序 各 步 的 例子 


迄今 为 止 ， 对 该 算法 的 描述 尚 缺少 许多 细节 ， 我 们 现在 就 来 补充 这 些 细节 。 实 现 第 2 步 
和 第 3 步 有 许多 方法 ， 这 里 介绍 的 方法 是 大 量 分 析 和 经 验 研 究 的 结果 ， 它 代表 实现 快速 排序 
的 非常 有 效 的 方法 ， 哪 怕 是 对 该 方法 最 微小 的 偏差 都 可 能 引起 意 想不到 的 不 良 结 果 。 


7.7.1 选取 枢纽 元 


虽然 上 面 描述 的 算法 无 论 选择 哪个 元 素 作 为 枢纽 元 都 能 完成 排序 工作 , 但 是 有 些 选择 
显然 更 优 。 
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一 种 错误 的 方法 

没有 经 过 充分 考虑 的 常见 选择 是 将 第 一 个 元 素 用 作 枢 纽 元 。 如 果 输 入 是 随机 的 ， 那 么 
这 是 可 以 接受 的 , 但 是 如 果 输 入 是 预 排 序 的 或 是 反 序 的 ， 那么 这 样 的 枢纽 元 就 产生 一 个 劣 
质 的 分 割 ， 因 为 所 有 的 元 素 不 是 都 被 划 入 S, 就 是 都 被 划 和 人 S; 。 更 有 其 者 ， 这 种 情况 可 能 发 
生 在 所 有 的 递归 调用 中 。 实 际 上 ， 如 果 第 一 个 元 素 用 作 枢 纽 元 而 且 输 入 是 预先 排序 的 ， 那 
么 快速 排序 花费 的 时 间 将 是 二 次 的 ， 可 是 实际 上 却 根 本 没 干什么 事 ， 这 是 相当 尴 众 的 。 然 
而 ， 预 排序 的 输入 (或 具有 一 大 段 预 排序 数据 的 输入 ) 是 相当 常见 的 ， 因 此 ， 使 用 第 一 个 元 
素 作为 枢纽 元 绝对 是 糟糕 的 主意 ， 应 该 立即 放弃 这 种 想法 。 男 一 种 想法 是 选取 前 两 个 互 异 
的 关键 字 中 的 较 大 者 作为 枢纽 元 ， 而 这 和 只 选取 第 一 个 元 素 作 为 枢纽 元 具有 相同 的 害处 。 
不 要 使 用 这 两 种 选取 枢纽 元 的 策略 。 

一 种 安全 的 做 法 

一 种 安全 的 方针 是 随机 选取 枢纽 元 。 一 般 来 说 这 种 策略 非常 安全 ， 除 非 随 机 数 生成 天 
有 问题 (这 并 不 罕见 )， 因 为 随机 的 枢纽 元 不 可 能 总 是 接连 不 断 地 产生 劣质 的 分 割 。 男 一 方 
面 ， 随 机 数 的 生成 一 般 是 昂贵 的 ， 根 本 减少 不 了 算法 其 余部 分 的 平均 运行 时 间 。 


三 数 中 值 分 割 法 (Median-of-Three Partitioning) 

一 组 NN 个 数 的 中 值 是 第 [ N/2 | 个 最 大 的 数 。 枢 纽 元 的 最 好 选择 是 数组 的 中 值 。 IIS SER 
是 ， 这 很 难 算出 ， 且 会 明显 减 慢 快 速 排序 的 速度 。 这 样 的 中 值 的 估计 量 可 以 通过 随机 选取 三 
个 元 素 并 用 它们 的 中 值 作为 枢纽 元 而 得 到 。 事 实 上 ， 随 机 性 并 没有 多 大 的 帮助 ， 因 此 一 般 的 
做 法 是 使 用 左 端 、 右 端 和 中 心 位 置 上 的 三 个 元 素 的 中 值 作为 枢纽 元 。 例 如 ， 输 入 为 8，1,，4， 
9，6，3，5，2，7，0， 它 的 左边 元 素 是 8， 右 边 元 素 是 0， 中 心 位 置 (L(Left 十 Right)/2 1]) 
上 的 元 素 是 6。 于 是 枢纽 元 是 v 王 6。 显然 使 用 三 数 中 值 分 割 法 消除 了 预 排序 输入 的 坏 情 形 ( 在 
这 种 情形 下 ， 这 些 分 割 都 是 一 样 的 )， 并 且 减 少 了 快速 排序 大 约 5% 的 运行 时 间 。 


E 


7.7.2 分 割 策略 
有 几 种 分 割 策略 用 于 实践 ， 但 此 处 描述 的 分 割 方法 能 够 给 出 好 的 结果 。 我 们 将 会 看 到 ， 

它 很 容易 做 错 或 效率 较 低 ， 不 过 使 用 一 种 已 知 的 方法 却 是 安全 的 做 法 。 该 方法 的 第 一 步 是 

通过 将 枢纽 元 与 最 后 的 元 素 交换 使 得 枢纽 元 离开 要 被 分 割 的 数据 段 。i 从 第 一 个 元 素 开始 而 

7 从 倒数 第 二 个 元 素 开始 。 如 果 最 初 的 输入 与 前 面 一 样 ， 那 么 下 面 的 图 表示 当前 的 状态 。 

| 


| 








1 4 9 0 3 5 2 7 «| 


i j | 














我 们 暂时 假设 所 有 的 元 素 互 异 ， 后 面 将 着 重 考虑 出 现 重 复元 素 时 应 该 怎么 办 。 作 为 一 
种 限制 性 的 情形 ， 如 果 所 有 的 元 素 都 相同 ， 那 么 我 们 的 算法 必须 做 相应 的 工作 。 可 是 奇怪 
的 是 ， 此 时 算法 却 特别 容易 出 错 。 

在 分 割 阶段 要 做 的 就 是 把 所 有 小 元 素 移 到 数组 的 左边 而 把 所 有 大 元 素 移 到 数组 的 右边 。 


当然 ,“ 小 ”和 “大 ”是 相对 于 枢纽 元 而 言 的 。 

M ij 的 左边 时 ,我 们 将 i 右 移 ， 移 过 那些 小 于 枢纽 元 的 元 素 ， 并 将 j 左 移 ， 移 过 那 
些 大 于 枢纽 元 的 元 素 。 当 i 和 j 停止 时 ,i 指向 一 个 大 元 素 而 7 指向 一 个 小 元 素 。 如 果 i 在 j 
的 左边 ， 那 么 将 这 两 个 元 素 互 换 ， 其 效果 是 把 一 个 大 元 素 移 向 右边 而 把 一 个 小 元 素 移 向 左 
边 。 在 上 面 的 例子 中 ，i 不 移动 ， 而 j 滑 过 一 个 位 置 ， 情 况 如 下 图 所 示 。 








8 
T i 








neal AN 











然后 我 们 交换 由 i 和 j 指向 的 元 素 ， 重 复 该 过 程 直到 i 和 7 彼此 交错 为 止 。 








p 






























































第 一 次 交换 后 | 
2 1 4 9 0 3 5 8 7 6 I 
1 T 
i j | 
第 三 次 交换 前 | 
2 1 4 9 0 3 x 8 7 6 
1 t 
i ] 
第 二 次 交换 后 
£ 1 4 5 0 3 9 8 F 6 
1 T 
1 ] 
第 三 次 交换 前 
2 1 4 5 0 3 9 8 7 6 
1 1 
j i 














此 时 , i 和 j 已 经 交错 ， 故 不 再 交换 。 分 割 的 最 后 一 步 是 将 枢纽 元 与 i 所 指向 的 元 素 交 换 。 











”与 枢纽 元 交换 后 
2 1 4 = 0 3 6 8 7 9 
1 1 








i pivot 








在 最 后 一 步 ， 当 枢纽 元 与 i 所 指向 的 元 素 交换 时 ,我 们 知道 在 位 置 Pi 的 每 一 个 元 素 都 
必然 是 小 元 素 ， 这 是 因为 或 者 位 置 P 包 含 一 个 从 它 开始 移动 的 小 元 素 , 或 者 位 置 P 上 原来 的 
大 元 素 在 交换 期 间 被 置换 了 。 类 似 的 论断 指出 ， 在 位 置 Pi 上 的 元 素 必然 都 是 大 元 素 。 

我 们 必须 考虑 的 一 个 重要 细节 是 如 何 处 理 那 些 等 于 枢纽 元 的 关键 字 。 问 题 在 于 ， 当 i 
遇 到 一 个 等 于 枢纽 元 的 关键 字 时 是 否 应 该 停止 ， 以 及 当 j 遇 到 一 个 等 于 枢纽 元 的 关键 字 时 
是 否 应 该 停止 。 直 观 地 看 ，i 和 j 应 该 做 相同 的 工作 ， 和 否则 分 割 将 出 现 偏向 一 方 的 倾向 。 例 
An. WR 停止 而 7 不 停 ， 那 么 所 有 等 于 枢纽 元 的 关键 字 都 将 被 分 到 S, rn. 
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为 了 搞 清楚 怎么 办 更 好 ， 我 们 考虑 数组 中 所 有 的 关键 字 都 相等 的 情况 。 如 果 i 和 j 都 停 
止 ， 那 么 在 相等 的 元 素 间 将 有 很 多 次 交换 。 虽 然 这 似乎 没有 什么 意义 ， 但 是 其 正面 的 效果 
Jui 和 7 将 在 中 间 交 错 ， 因 此 当 酌 纽 元 被 替代 时 ， 这 种 分 割 建立 了 两 个 几乎 相等 的 子 数 
组 。 归 并 排序 分 析 告 诉 我 们 ， 此 时 总 的 运行 时 间 为 O(N log ND. 

AN iR; 都 不 停止 ， 那么 就 应 该 有 相应 的 程序 防止 i 和 j 越 出 数组 的 界限 ， 不 执行 交 
换 操作 。 虽 然 这 样 似乎 不 错 ， 但 是 正确 的 实现 方法 却 是 把 枢纽 元 交换 到 i 最 后 到 过 的 位 置 ， 
这 个 位 置 是 倒数 第 二 个 位 置 (或 最 后 的 位 置 ， 这 依赖 于 精确 的 实现 方法 )。 这 样 的 做 法 将 会 
产生 两 个 非常 不 均衡 的 子 数组 。 如 果 所 有 的 关键 字 都 是 相同 的 ， 那 么 运行 时 间 是 OCN2 ) 的 。 
对 于 预 排序 的 输入 而 言 ， 其 效果 与 使 用 第 一 个 元 素 作 为 枢纽 元 相同 。 它 花费 的 时 间 是 二 次 
的 ， 可 是 却 什 么 事 也 没 干 ! 

这 样 我 们 就 发 现 ， 进 行 不 必要 的 交换 建立 两 个 均衡 的 子 数 组 要 比 蛮 干 冒险 得 到 两 个 不 
均衡 的 子 数组 好 。 因 此 ， 如 果 cR; 遇 到 等 于 枢纽 元 的 关键 字 ， 那 么 我 们 就 让 i 和 7 都 停 
止 。 对 于 这 种 输入 ， 这 实际 上 是 不 花费 二 次 时 间 的 四 种 可 能 性 中 唯一 的 一 种 可 能 。 

初 看 起 来 ， 过 多 考虑 具有 相同 元 素 的 数组 似乎 有 些 思春 。 难 道 有 人 偶 要 对 5 000 个 相同 
的 元 素 排序 吗 ? 为 什么 ? 我 们 记得 ， 快 速 排序 是 递归 的 。 设 有 100 000 个 元 素 ， 其 中 有 
5 000 个 是 相同 的 。 最 后 ， 快 速 排序 将 对 这 5 000 个 元 素 进 行 递归 调用 。 此 时 ， 真 正 重 要 的 
在 于 确保 这 5 000 个 相同 的 元 素 能 够 被 有 效 地 排序 。 








7.7.3 小 数组 


对 于 很 小 的 数组 CN 委 20)， 人 快速 排序 不 如 插入 排序 好 。 不 仅 如 此 ， 因 为 快速 排序 是 递 
归 的 ， 所 以 这 样 的 情形 还 经 常 发 生 。 通 党 的 解决 方法 是 对 于 小 的 数组 不 是 递归 地 使 用 快速 
排序 ， 而 是 使 用 诸如 插入 排序 这 样 对 小 数组 有 效 的 排序 算法 。 使 用 这 种 策略 实际 上 可 以 节 
BRA 15%( 相 对 于 自始至终 使 用 快速 排序 时 ) 的 运行 时 间 。 一 种 好 的 截止 范围 (cutoff 
range) dé N=10, 虽然 在 5 到 20 之 间 任 意 截止 范围 部 有 可 能 产生 类 似 的 结果 。 这 种 做 法 也 
避免 了 一 些 有 害 的 特殊 情形 ， 如 取 三 个 元 素 的 中 值 而 实际 上 却 只 有 一 个 或 两 个 元 素 的 情况 。 


7.7.4 实际 的 快速 排序 例 程 


快速 排序 的 驱动 程序 见 图 7-12。 

这 种 例 程 的 一 般 形式 将 是 传递 数组 以 及 被 排序 
数组 的 范围 Left ( 左 端 ) 和 Right HA). EAE | Yeli sorte Elenentype AL J, int N) 
的 第 一 个 例 程 是 枢纽 元 的 选取 。 选 取 枢 纽 元 最 容易 | { asortCA o N= 19: 

的 方法 是 对 A[Left]、A[Right]、A[center] 适 | ? 
当地 排序 。 这 种 方法 还 有 额外 的 好 处 ， 即 该 三 元 素 
中 的 最 小 者 被 分 在 A[Left]， 而 这 正 是 分 割 阶段 应 
该 将 它 放 到 的 位 置 。 三 元 素 中 的 最 大 者 被 分 在 A[Right]， 这 也 是 正确 的 位 置 ， 因 为 它 大 
于 枢纽 元 。 因 此 ， 我 们 可 以 把 枢纽 元 放 到 AL Right 一 1] 并 在 分 割 阶段 将 i 和 j 初始 化 到 














图 7-12 快速 排序 的 驱动 程序 


Left 十 1 #l Right 一 2。 因 为 ALDeft] 比 枢纽 元 小 ， 所 以 将 它 用 作 7 的 警戒 标记 ， 这 是 另 一 
个 好 处 。 因 此 ， 我 们 不 必 担 心 j 越界 。 由 于 i 将 停 在 那些 等 于 枢纽 元 的 关键 字 处 ， 故 将 枢纽 元 
存储 在 ALRight 一 1]， 将 提供 一 个 警戒 标记 。 图 7-13 中 的 程序 进行 三 数 中 值 分 割 ， 它 具有 所 
描述 的 所 有 附加 的 作用 。 似 乎 使 用 实际 上 不 对 ALLeft ]|、A[LRignt]、ALcenter |] 排序 的 方法 
计算 枢纽 元 只 不 过 效率 稍微 降低 一 些 ， 但 是 很 奇怪 ， 这 将 产生 坏 结果 ( 见 练习 7. 38)。 





/* Return median of Left, Center, and Right */ 
/* Order these and hide the pivot */ 


ElementType 
Median3( ElementType A[ ], int Left, int Right ) 
{ 

int Center = ( Left + Right ) / 2; 


ifC AL Left ] > A[ Center ] ) 

Swap( &A[ Left ], &A[ Center ] ); 
ifC AL Left ] > A[ Right ] ) 

Swap( &A[ Left ], &A[ Right ] ); 
ifC AL Center ] > AL Right ] ) 

Swap( &A[ Center ], &A[ Right ] ); 


/* Invariant: A[ Left ] <= A[ Center ] <= A[ Right ] */ 


Swap( &A[ Center ], &A[ Right - 1] 5; /* Hide pivot */ 
return A[ Right - 1 ]; /* Return pivot */ 











图 7-13 实现 三 数 中 值 分 割 方法 的 程序 


图 7-14 的 程序 是 快速 排序 真正 的 核心 。 它 包括 分 割 和 递归 调用 。 这 里 有 几 件 事 值 得 注 
意 。 第 3 行将 i 和 j 初始 化 为 比 它们 的 正确 值 大 1， 使 得 不 存在 需要 考虑 的 特殊 情况 。 此 处 





#define Cutoff ( 3 ) 


void 
Qsort( ElementType A[ ], int Left, int Right ) 
{ 


WE 74-94 

ElementType Pivot; 
pr as] if( Left + Cutoff <= Right ) 

{ 
Je 25 Pivot = Median3( A, Left, Right ); 
/* 3*/ i = Left; j = Right = 1; 
/* 4*/ forge y £2 

{ 
4 bs whileC A[ ++i ] « Pivot ){ } 
/* 6*/ whileC A[ --j ] > Pivot ){ } 
/* 7*/ TEC, d mq 3 
A Bf SwapC &A[ i J], SAL j 1D; 
else 
J= 957 break; 
} 

/*10*/ Swap( &A[ i ], &A[ Right - 1 ] 5; /* Restore pivot */ 
fr), Qsort( A, Left, i = 1); 
/*12*/ Qsort( A, i + 1, Right ); 

} 

else /* Do an insertion sort on the subarray */ 
/*13*/ InsertionSort( A + Left, Right - Left + 1 ); 

} 











7-14 快速 排序 的 主 例 程 
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的 初始 化 依赖 于 三 数 中 值 分 割 法 有 一 些 附 加 作用 的 事实 。 如 果 按照 简单 的 枢纽 元 策略 使 用 
该 程序 而 不 进行 修正 ， 那 么 这 个 程序 是 不 能 正确 运行 的 ， 原 因 在 于 ;和 /开始 于 错误 的 位 置 
而 不 再 存在 7 的 警戒 标志 。 

第 8 行 的 Swap 为 了 速度 上 的 考虑 有 时 显 式 写 出 。 为 使 算法 速度 快 ， 需 要 人 迫使 编译 器 以 
直接 插入 的 方式 编译 这 些 代 码 。 为 此 ， 许 多 编译 器 都 自动 这 么 做 ， 但 对 于 不 这 么 做 的 编译 
器 ， 差 别 可 能 很 明显 。 

最 后 ， 从 第 5 行 和 第 6 行 可 看 出 为 什么 快 
XH GEAR. EOEBUPIBEURTRHI— RAE LA | Ie ae) forces 1o Nam o 
1 运算 ( 它 很 快 )、 一 个 测试 以 及 一 个 转移 组 成 。 J* 5*/ À whileC AL i ] < Pivot ) i++; 

该 算法 没有 像 归 并 排序 中 那样 的 额外 技巧 , 不 | 2 RC e 110 Pivot n 
过 ， 这 个 程序 仍然 出 奇 复杂 。 令 人 感 兴趣 的 是 | OEY ase POTI T 8L 3 135 
将 第 3 一 9 行 用 图 7-15 中 列 出 的 语句 代替 , 这 | C0 y rcs 

是 不 能 正确 运行 的 ， 因 为 若 ALI =A I= 
Pivot， 则 会 产生 一 个 无 限 循环 。 图 7-15 “对 快速 排序 小 的 改动 ， 它 将 中 断 该 算法 














7.7.5 快速 排序 的 分 析 


正如 归并 排序 那样 ， 快 速 排序 也 是 递归 的 ， 因 此 ， 它 的 分 析 需 要 求解 一 个 递 推 公式 。 
我 们 将 对 快速 排序 进行 这 种 分 析 ， 假设 有 一 个 随机 的 枢纽 元 (不 用 三 数 中 值 分 割 法 )， 对 一 
些小 的 文件 也 不 使 用 截止 范围 。 和 归并 排序 一 样 ， 取 TOO = TO =1, 快速 排序 的 运行 时 
间 等 于 两 个 递归 调用 的 运行 时 间 加 上 花费 在 分 割 上 的 线性 时 间 ( 枢 纽 元 的 选取 仅 花 费 常 数 时 
间 )。 我 们 得 到 基本 的 快速 排序 关系 : 














TON) = TG) + TON —i— D +cN (7.1) 
其 中 , i= |S | 是 S, 中 的 元 素 个 数 。 我 们 将 考察 三 种 情况 。 
最 坏 情 形 的 分 析 
枢纽 元 始终 是 最 小 元 素 。 此 时 i 二 0， 如 果 我 们 忽略 无 关 紧 要 的 T(0) 二 1， 那 么 北 推 关系 为 
TIN) = T(N—1)+cN,N>1 (7.2) 
反复 使 用 式 (7. 2) ， 我 们 得 到 
TUN = 13e TUN —2) J-eCN — 1j (7.3) 
TUN —2)— T(N—3) -FeCN — 2) (7. 4) 
T(2)= T(D + (2) (7.5) 


将 所 有 这 些 方程 相 加 ， 得 到 


T(N) = TOD +¢ >i = OWN) (7. 6) 
这 正 是 我 们 前 面 宣布 的 结果 。 


最 好 情形 的 分 析 
在 最 好 的 情形 下 ， 枢 纽 元 正好 位 于 中 间 。 为 了 简化 数学 推导 ， 我 们 假设 两 个 子 数组 恰 


i 二 


好 各 为 原 数组 的 一 半 大 小 ， 虽 然 这 会 给 出 稍微 过 高 的 估计 ， 但 是 由 于 我 们 只 关心 大 ORR, 
因此 结果 还 是 可 以 接受 的 。 

T(N) = 2T(N/2)+eN (7. 7) 
用 N 去 除 式 (7.7) 的 两 边 ， 


TWN) _ TCN/2) 
N N/2 





+e (7. 8) 


我 们 反复 套用 这 个 方程 ， 得 到 
T(N/2)__ TCN/4) 











ae NA te (7.9) 
T(N/4)__ TCN/D , 
WH WET (7. 10) 
Ty TQ) 
E D (7.11) 
将 从 式 (7.7) 到 式 (7. 11) 的 方程 加 起 来 ， 并 注意 到 它们 共有 log N 个 ， 于 是 
e -" LU Lr Jae N (7.12) 
由 此 得 到 
T(N) = cN log N+ N = O(N log N) (7. 13) 
注意 ， 这 和 归并 排序 的 分 析 完 全 相同 ， 因 此 ， 我 们 得 到 相同 的 答案 。 
平均 情形 的 分 析 


这 是 最 难 的 部 分 。 对 于 平均 情形 ,我们 假设 对 于 S 每 一 个 文件 大 小 都 是 等 可 能 的 ， 因 
此 每 个 大 小 均 有 概率 1/N。 这 个 假设 对 于 这 里 的 枢纽 元 选取 和 分 割 方法 实际 上 是 合理 的 ， 
不 过 ， 对 于 某 些 其 他 情况 它 并 不 合理 。 那 些 不 保持 子 文件 (subfile) 随 机 性 的 分 割 方法 不 能 
使 用 这 种 分 析 方 法 。 有 趣 的 是 ， 这 些 方法 看 来 导致 程序 在 实际 运行 中 花费 更 长 的 时 间 。 


由 该 假设 可 知 ，T(2) (从 而 T(N 一 i 一 1)) 的 平均 值 为 G/N) TG), 此 时 式 (7. 1) 变 成 


2 
T(N) = xp (7.14) 
如 果 用 N 乘 以 式 (7. 14), ， 则 有 
NT(N) = 2[ >) TG) Hen? (7. 15) 
我 们 需要 除去 求 和 符号 以 简化 计算 。 注 意 ， 可 以 再 套用 一 次 式 (7. 15) ， 得 到 


N—2 
(N—DTON—1) = 2| 2 TG) + e(N— f (7. 16) 
若 从 式 (7. 15) 减 去 式 (7. 16) ， 则 得 到 
NT(N) — (N— DT(N— D = 2T(N—1) + XN —c C7, 185 
移 项 、 合 并 并 除去 右边 无 关 紧 要 的 项 一 <-， 我 们 得 到 
NTON) = (N+1)TCN—1) + 2cN (7. 18) 


194 


[244 | 


[245] 


数据 结构 与 算法 分 析 C 语言 描述 


现在 有 了 一 个 只 用 T(N 一 1) 表 示 TC(N) 的 公式 。 再 用 又 缩 公式 的 思路 ， 不 过 式 (7. 18) 


的 形式 不 适合 。 为 此 ， 用 N(N 十 1) 除 式 (7. 18): 

















TiN). N=) 2 
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将 式 (7. 19) dX C7. 22) 相 加 ， 得 到 
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该 和 大 约 为 log (N+1)+y—3, 其 中 ys*0. 577 叫 作 欧 拉 常数 (Euler's constant). FE 


T(N) 


MUNI O(log N) 


(7. 24) 


从 而 
T(N) = O(N log N) (1.25) 
虽然 这 里 的 分 析 看 似 复 杂 ， 但 是 实际 上 并 不 复杂 一 一 一 旦 你 看 出 某 些 递 推 关系 ， 这 些 
步骤 就 是 很 自然 的 。 该 分 析 实 际 上 还 可 以 再 进一步 。 上 面 描述 的 高 度 优化 的 形式 也 已 分 析 
过 ， 结 果 的 获得 非常 困难 ， 涉 及 一 些 复杂 的 递归 和 高 深 的 数学 。 相 等 关键 字 的 影响 也 已 仔 
细 地 进行 了 分 析 ， 实 际 上 所 介绍 的 程序 就 是 这 么 做 的 。 


7.7.6 选择 的 线性 期 望 时 间 算法 


可 以 修改 快速 排序 以 解决 选择 问题 (selection problem)， 这 种 问题 我 们 在 第 1 章 和 第 6 
章 已 经 看 到 。 当 时 ， 通 过 使 用 优先 队列 ， 我 们 能 够 以 O(N 十 k log N) 时 间 找 到 第 & 个 最 大 
(最 小 ) 元 。 对 于 查找 中 值 的 特殊 情况 ， 它 给 出 一 个 O(N log N) 算 法 。 

由 于 我 们 能 够 以 OCN log N) 时 间 给 数组 排序 ， 因 此 可 以 期 望 为 选择 问题 得 到 一 个 更 好 
的 时 间 界 。 我 们 介绍 的 查找 集合 S 中 第 个 最 小 元 的 算法 几乎 与 快速 排序 相同 。 事实 上 ， 
其 前 三 步 是 一 样 的。 我 们 将 把 这 种 算法 叫 作 快速 选择 (quickselect)。 令 |S; | Jy S; 中 元 素 的 
个 数 。 快 速 选择 的 步骤 如 下 : 

1. 如 果 |S| 二 1， 那么 二 1， 并 将 S 中 的 元 素 作 为 答案 返回 。 如 果 使 用 小 数组 的 截止 
(cutoff) 方 法 且 |S| 达 cuToFF， 则 将 S 排序 并 返回 第 & 个 最 小 元 。 

2. 选取 一 个 枢纽 元 vE S. 

3. 将 集合 S 一 {v) 分 割 成 S. 和 S;， 就 像 我 们 在 快速 排序 中 所 做 的 那样 。 

4. 如 果 k 二 1S1|， 那 么 第 个 最 小 元 必然 在 S, 中 。 在 这 种 情况 下 ， 返 回 quickse- 


lect(S,. k). WR k=1+|S |， 那么 枢纽 元 就 是 第 上 个 最 小 元 ,我们 将 它 作为 答案 返回 
否则 ， 这 第 & 个 最 小 元 就 在 S, P, CE S 中 的 第 (k 一 |Si | 一 1) 个 最 小 元 。 我 们 进行 一 次 
递归 调用 并 返回 quickselect(S,, k& 一 |S | 一 1)。 

与 快速 排序 相 比 ， 快 速 选择 只 做 了 一 次 递归 调用 而 不 是 两 次 。 快 速 选择 的 最 坏 情 形 和 
快速 排序 的 相同 ， 也 是 O(N?* )。 直 观看 来 ， 这 是 因为 快速 排序 的 最 坏 情 形 发 生 在 S 和 S, 
有 一 个 是 空 的 时 候 ， 于 是 ， 快 速 选择 也 就 不 是 真 的 节省 一 次 递归 调用 。 不 过 , 平均 运行 时 
间 是 O(N)。 具 体 分 析 类 似 于 快速 排序 的 分 析 ， 我 们 将 它 留 作 练习 题 

ea nt nila 其 程序 见 图 7-16。 当 算法 终止 时 ， 第 k 
个 最 小 元 就 在 位 置 k 上 。 这 破坏 了 原来 的 排序 ， 如 果 不 希 望 这 样 ， 那 么 需要 做 一 份 拷贝 。 





/* Places the kth smallest element in the kth position */ 
/* Because arrays start at 0, this will be index k-1 */ 
void 
Qselect( ElementType A[ ], int k, int Left, int Right ) 
{ 
int 1, j 
ElementType Pivot; 
[* 1*/ if( Left + Cutoff <= Right ) 
{ 
f* 2*/ Pivot - Median3( A, Left, Right ); 
A 3*/ i = Left; j = Right = 1; 
[PANS forC $ $2 
{ 
IE SEP while( A[ ++i ] < Pivot ){ } 
f= 6*/ while( A[ --j ] > Pivot ){ } 
/* 7*/ TEC t= 7D 
EE 8*/ Swap( &A[ i ], &4[ j 1D; 
else 
/* 9*/ break; 
} 
/*10*/ Swap( &A[ i ], &A[ Right - 1 ] ); /* Restore pivot */ 
/*11*/ ifC k <i) 
/*12*/ Qselect( A, k; Left, i - 1); 
VL else if( k>i+1) 
/*14*/ Qselect( A, k, i + 1, Right ); 
else /* Do an insertion sort on the subarray */ 
/*15*/ InsertionSort( A + Left, Right - Left + 1 ); 
} 











图 7-16 快速 选择 的 主 例 程 


使 用 三 数 中 值 选 取 枢 纽 元 的 方法 使 得 最 坏 情形 发 生 的 机 会 微乎其微 。 然 而 ,通过 仔细 
选择 枢纽 元 ， 我 们 可 以 消除 二 次 的 最 坏 情形 而 保证 算法 是 OCN) 的 。 可 是 这 么 做 的 额外 开销 
是 相当 大 的 ， 因 此 最 终 的 算法 主要 在 于 理论 上 的 意义 。 在 第 10 章 我 们 将 考察 选择 问题 的 线 
性 时 间 最 坏 情 形 算法 ,我 们 还 将 看 到 选取 枢纽 元 的 一 个 有 趣 技巧 ， 它 使 得 选择 算法 在 实践 
由 多 少 要 快 一 些 。 


7.8 大 型 结构 的 排序 
关于 之 前 的 排序 讨论 ， 我们 已 经 假设 要 排序 的 元 素 是 一 些 简单 的 整数 。 常 常 需要 通过 
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某 个 关键 字 对 大 型 结构 进行 排序 。 例 如 ,我 们 可 能 有 一 些 工资 名 单 的 记录 ， 每 个 记录 由 姓 
名 、 地 址 、 电 话 号 码 、 诸 如 工资 这 样 的 财务 信息 以 及 税务 信息 组 成 。 我 们 可 能 想 要 通过 一 
个 特定 的 域 ( 比 如 姓名 ) 来 对 这 些 信息 进行 排序 。 对 于 所 有 的 算法 来 说 ， 基 本 的 操作 就 是 交 
换 ， 不 过 这 里 交换 两 个 结构 可 能 是 非常 昂贵 的 操作 ， 因 为 结构 实际 上 很 大 。 在 这 种 情况 下 ， 
实际 的 解法 是 让 输入 数组 包含 指向 结构 的 指针 。 我 们 通过 比较 指针 指向 的 关键 字 ， 并 在 必 
RN 行 排序 。 这 意味 着 ， 所 有 的 数据 运动 基本 上 就 像 我 们 对 整数 排序 那样 进 
。 我 们 称 之 为 间接 排序 (indirect sorting)， 可 以 使 用 这 种 方法 处 理 我 们 已 经 描述 过 的 大 部 
Sen, 这 证 明 我 们 关于 复杂 数据 结构 处 理 时 不 必 大 量 牺牲 效率 的 假设 是 正确 的 。 


7.9 排序 的 一 般 下 界 


虽然 我 们 得 到 一 些 O(N log N) 的 排序 算法 ， 但 是 ， 尚 不 清楚 我 们 是 否 还 能 做 得 更 好 。 
本 节 证 明 任 何 只 用 到 比较 的 算法 在 最 坏 情 形 下 需要 QCN log N) 次 比较 (从 而 需要 
ACN log N) 时 间 )， 因 此 归并 排序 和 堆 排 序 在 一 个 常数 因子 范围 内 是 最 优 的 。 可 以 进一步 
证 明 即 使 是 在 平均 情形 下 ， 只 用 到 比较 的 任意 排序 算法 都 需要 进行 QCN log N) 次 比较 。 这 
意味 着 ， 快 速 排序 在 相差 一 个 常数 因子 的 范围 内 平均 是 最 优 的 。 

尤其 , 我 们 将 证 明 下 列 结果 ; 只 用 到 比较 的 任何 排序 算法 在 最 坏 情 形 下 都 需要 
[logCN1)1 次 比较 并 平均 需要 log(N1) 次 比较 。 我 们 将 假设 所 有 N 个 元 素 是 互 异 的 ， 因 为 
任何 排序 算法 都 必须 在 这 种 情况 下 正常 运行 。 


决策 树 


决策 树 (decision tree) 是 用 于 证 明 下 界 的 抽象 概念 。 在 这 里 ， 决 策 树 是 一 棵 二 又 树 。 每 
个 节点 表示 在 元 素 之 间 一 组 可 能 的 排序 ， 它 与 已 经 进行 的 比较 一 致 。 比 较 的 结果 是 
树 的 边 。 

图 7-17 中 的 决策 树 表 示 将 三 个 元 素 a, b 和 排序 的 算法 。 pp (我 
们 将 互 换 地 使 用 术语 状态 和 节点 。) 没 有 进行 比较 ， 因 此 所 有 的 顺序 都 是 合 个 特定 的 
算法 进行 的 第 一 次 比较 是 比较 a 和 b. isa eels cheno rip 
只 有 三 种 可 能 性 被 保留 。 如 果 算 法 到 达 节 点 2， 那 么 它 将 比较 a 和 c。 其 他 算法 可 能 会 做 不 同 
的 工作 ， 不 同 的 算法 可 能 有 不 同 的 决策 树 。 若 < 二 <， 则 算法 进入 状态 5。 由 于 只 存在 一 种 顺 
序 ， 因 此 算法 可 以 终止 并 报告 它 已 经 完成 了 排序 。 若 4 二 c， 则 算法 尚 不 能 终止 ， 因 为 存在 两 
种 可 能 的 顺序 ， 它 还 不 能 肯定 哪 种 是 正确 的 。 在 这 种 情况 下 ， 算 法 还 将 需要 一 次 比较 。 

只 使 用 比较 进行 排序 的 每 一 种 算法 都 可 以 用 决策 树 表 示 。 当 然 ， 只 有 输入 数据 非常 少 
的 情况 下 画 决策 树 才 是 可 行 的 。 排 序 算法 所 使 用 的 比较 次 数 等 于 最 深 的 树叶 的 深度 。 在 我 
们 的 例子 中 ， 该 算法 在 最 坏 的 情形 下 使 用 了 三 次 比较 。 所 使 用 的 比较 的 平均 次 数 等 于 树叶 
的 平均 深度 。 由 于 决策 树 很 大 ， 因 此 必然 存在 一 些 长 的 路 径 。 为 了 证 明 下 界 ， 需 要 证 明 某 
些 基本 的 树 性 质 。 
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图 7-17 三 元 素 排序 的 决策 树 








引 理 7.1 令 丁 是 深度 为 d HAZLAR, N TRZA? 片 树叶 。 

WEAR: 用 数学 归纳 法 证 明 。 如 果 4 二 0， 则 最 多 存在 一 片 树叶 ， 因 此 基准 情形 为 真 。 否 
则 ， 存 在 一 个 根 ， 它 不 可 能 是 树叶 ， 其 左 子 树 和 右 子 树 中 每 一 棵 的 深度 最 多 是 d—1. BH 
纳 假设 ,每 一 棵 子 树 最 多 有 2”' 片 树叶 ， 因 此 该 树 最 多 有 2 片 树叶 。 这 就 证 明了 该 引 理 。 

引 理 7.2 具有 上 片 树叶 的 二 又 树 的 深度 至 少 是 [log L ]. 

WEAR: 由 前 面 的 引 理 立即 推出 。 

定理 7.6 只 使 用 元 素 间 比较 的 任何 排序 算法 在 最 坏 情形 下 至 少 需要 「 logCNI)] 次 比较 。 

WEAR: 对 NN 个 元 素 排序 的 决策 树 必然 有 N! 片 树 叶 。 从 上 面 的 引 理 即 可 推出 该 定理 。 

定理 7.7 只 使 用 元 素 间 比较 的 任何 排序 算法 需要 进行 0(N log N) 次 比较 。 

WEBB: 由 前 面 的 定理 可 知 ， 需 要 log(N1) 次 比较 。 

log(N!)= logC(NCN 一 1)(N 一 2)…(2)(1)) 
= log N+ log(N — 1) + log(N — 2) + ++ + log 2+ log 1 





> logN + log(N — 1) + log(N — 2) ++ + logN/2 > 2 log Ñ hee 
| 249. 
> Slog N N = ACN log N) 


当 用 于 证 明 最 坏 情 形 结果 时 ， 这 种 类 型 的 下 界 论 断 有 时 叫 作 信息 -理论 (information- 
theoretic) 下 界 。 一 般 定 理 说 的 是 ， 如 果 存 在 已 种 不 同 的 情况 要 区 分 ， 而 问题 是 YES/NO 
的 形式 ， 那 么 通过 任何 算法 求解 该 问题 在 某 种 情形 下 总 需要 「 log P 1 个 问题 。 对 于 任何 基于 
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比较 的 排序 算法 的 平均 运行 时 间 ， 证明 类 似 的 结果 是 可 能 的 。 这 个 结果 由 下 列 引 理 导出 ， 
我 们 将 它 留 作 练 习 : 具有 二 片 树叶 的 任意 二 义 树 的 平均 深度 至 少 为 log L. 


7.10 棚 式 排序 


虽然 我 们 在 上 一 节 证 明了 任何 只 使 用 比较 的 一 般 排 序 算 法 在 最 坏 情 形 下 需要 运行 时 间 
ACN log N)， 但 是 我 们 要 记 住 ， 在 某 些 特殊 情况 下 以 线性 时 间 进 行 排序 仍然 是 可 能 的 。 

一 个 简单 的 例子 是 桶 式 排序 (bucket sort) 。 为 使 桶 式 排序 能 够 正常 工作 ， 必 须要 有 一 
些 额外 的 信息 。 输 入 数据 Al. As cns Ay 必须 只 由 小 于 M 的 正 整数 组 成 。( 显 然 还 可 以 
对 其 进行 扩充 。) 如 果 是 这 种 情况 ,那么 算法 很 简单 : 使 用 一 个 大 小 为 M FK Count 的 数 
组 ， 它 被 初始 化 为 全 0。 于 是 ，count 有 M 个 单元 (或 称 桶 )， 这 些 桶 初始 化 为 空 。 当 读 A, 
时 ，Count[A;j 增 1。 在 所 有 的 输入 数据 读 和 人 人 后， 扫描 数组 count， 打 印 出 排序 后 的 表 。 该 
算法 用 时 OCM 十 N) ,其 证 明 留 作 练 习 。 如 果 M HOON), 那么 总 量 就 是 OCN)。 

虽然 这 个 算法 似乎 干扰 了 下 界 ， 但 事实 上 并 没有 ， MS di bf Rus pipa iiu 
的 操作 。 通 过 使 适当 的 桶 增值 ， 算 法 在 单位 时 间 内 实际 上 执行 了 一 个 ML 路 比较 。 这 类 似 于 
用 在 可 扩散 列 上 的 策略 ( 见 5.6 节 )。 ea tt 

不 过 ， 该 算法 确实 提出 了 用 于 证 明 下 界 的 模型 的 合理 性 问题 。 这 个 模型 实际 上 是 一 个 
强 模 型 ， ep eben Eee RE Bd a dod: 设 ， 但 必须 基于 排序 信 
息 做 一 些 决策 。 很 自然 地 ， 如 果 存 在 额外 的 可 用 信息 ,我们 应 该 有 望 找 到 更 为 有 效 的 算法 ， 
否则 这 额外 的 信息 就 被 浪费 了 。 

尽管 桶 式 排序 看 似 太 平凡 ， 用 处 不 大 ,但 是 实际 上 却 存 在 许多 其 输入 只 是 一 些小 的 整 
数 的 情况 ， 使 用 像 快 速 排序 这 样 的 排序 方法 真 的 是 小 题 大 做 了 。 


7.11 外 部 排序 


迄今 为 止 ， 我 们 考察 过 的 所 有 算法 都 需要 将 输入 数据 装 人 内 存 。 然 而， 存在 一 些 应 用 
程序 ， 它 们 的 输入 数据 量 太 大 装 不 进 内 存 。 本 节 将 讨论 一 些 外 部 排序 (external sorting) $: 
法 ， 它 们 是 设计 用 来 处 理 很 大 的 输入 的 。 


7.11.1 为 什么 需要 新 的 算法 
大 部 分 内 部 排序 算法 都 用 到 内 存 可 直接 寻 址 的 事实 。 和 硕 尔 排序 用 一 个 时 间 单 位 比较 元 
素 ALilM A[Li 一 hi ]。 堆 排序 用 一 个 时 间 单 位 比较 元 素 ALi] 和 ALix2 十 1]。 使 用 三 数 中 值 
分 割 法 的 快速 排序 以 常数 个 时 间 单 位 比较 ALLeft]、ALcenter] 和 ALRignt]。 如 果 输 入 
数据 在 磁带 上 ， 那 么 所 有 这 些 操 作 就 失去 了 它们 的 效率 ， 因 为 磁带 上 的 元 素 只 能 被 顺序 访 
间 。 即 使 数据 在 一 张 磁盘 上 ， 由 于 转动 磁盘 和 移动 磁头 所 需 的 延迟 ， 仍 然 存在 实际 上 的 效 
为 了 看 到 外 部 访问 究竟 有 多 慢 ， 可 建立 一 个 大 的 随机 文件 ， 但 不 能 太 大 以 致 装 不 进 内 


存 。 读 入 该 文件 并 用 一 种 有 效 的 算法 对 其 排序 。 与 将 输入 数据 读 入 所 花费 的 时 间 相 比 ， 将 
该 输入 数据 进行 排序 所 花费 的 时 间 必 然 是 无 足 轻 重 的 ， 尽 管 排序 是 O(N log N) 操 作 而 读 入 
数据 只 不 过 花费 O(N) 时 间 。 


7.11.2 外 部 排序 模型 


各 种 各 样 的 海量 存储 装置 使 得 外 部 排序 比 内 部 排序 对 设备 的 依赖 性 要 严重 得 多 。 我 们 
将 考虑 的 一 些 算法 在 磁带 上 工作 ， 而 磁带 可 能 是 最 受 限制 的 存储 媒体 。 由 于 访问 磁带 上 的 
一 个 元 素 需 要 把 磁带 转动 到 正确 的 位 置 ， 因 此 磁带 必须 要 有 (两 个 方向 上 ) 连 续 的 顺序 才能 
够 被 有 效 地 访问 。 

我 们 将 假设 至 少 有 三 个 磁带 驱动 器 进行 排序 工作 。 我 们 需要 两 个 驱动 器 执行 有 效 的 排 
序 ， 而 第 三 个 驱动 器 进行 简化 的 工作 。 如 果 只 有 一 个 磁带 驱动 器 可 用 ， 那么 我 们 不 得 不 说 : 
任何 算法 都 将 需要 ON? ) 次 磁带 访问 。 


7.11.3 简单 算法 


基本 的 外 部 排序 算法 使 用 归并 排序 中 的 Merge 例 程 。 设 我 们 有 四 盘 磁 带 Ta. Ta. 
Th、T2， 它 们 是 两 盘 输 入 磁带 和 两 盘 输 出 磁带 。 根 据 算法 的 特点 ， 磁 带 a 和 磁带 4 要 么 用 
作 输 入 磁带 ， 要 么 用 作 输 出 磁带 。 设 数据 最 初 在 T,, 上 ， 并 设 内 存 可 以 一 次 容纳 (和 排序 )M 
个 记录 。 一 种 自然 的 做 法 是 第 一 步 从 输入 磁带 一 次 读 人 M 个 记录 ,在 内 部 将 这 些 记录 排 
序 ， 然 后 再 把 这 些 排 过 序 的 记录 交替 地 写 到 Tu 或 Te 上 。 我 们 将 把 每 组 排 过 序 的 记录 叫 作 
一 个 顺 串 (run) 。 做 完 这 些 之 后 ， 倒 回 所 有 的 磁带 。 设 我 们 的 输入 与 希 尔 排序 例子 中 的 输入 
数据 相同 。 








| Ta St 94 Jt 96 2: 325: 17 99 28 SS a FS B 











如 果 M=3， 那 么 在 顺 串 构造 以 后 ， 磁 带 将 包含 下 图 所 指出 的 数据 。 


Ta 
Taz 
To 
Ti; 


现在 T, f T, BI —28 ER. RE RET is 0 5i — 1 LER Ho HB OPE SF. TESS 
RSS T. 上， 该 结果 是 一 个 两 倍 长 的 顺 串 。 然 后 ， 我 们 再 从 每 盘 磁 带 取 出 下 一 个 顺 串 ， 合 
并 ， 并 将 结果 写 到 T 上。 继续 这 个 过 程 ， 交 替 使 用 Tu 和 To. AB Ti 或 To 为 空 。 此 时 ， 
或 者 T 和 Ta 均 为 空 ， 或 者 剩 下 一 个 顺 串 。 对 于 后 者 ,我们 把 剩 下 的 顺 串 拷贝 到 适当 的 顺 
串 上 。 将 全 部 四 盘 磁 带 倒 回 ， 并 重复 相同 的 步 又， 这 一 次 用 两 盘 a 磁带 作为 输入 ， 两 盘 b 
磁带 作为 输出 ， 结 果 得 到 一 些 4M 的 顺 串 。 我 们 继续 这 个 过 程 直 到 得 到 长 为 N 的 一 个 顺 串 。 





| 
11 81 94 17 28 99. 15 
12 35 96 41 58 75 

















200 数据 结构 与 算法 分 析 C 语言 描述 


该 算法 将 需要 「 log N/M 1] 趟 工作 ， 外 加 一 趟 构造 初始 的 顺 串 。 例 如 ， 若 有 1000 万 个 
记录 ， 每 个 记录 128 个 字 节 ， 并 有 4 兆 字 节 的 内 存 ， 则 第 一 趟 将 建立 320 个 顺 串 。 此 时 我 
们 再 需要 9 趟 以 完成 排序 。 我 们 的 例子 再 需要 | log 13/3 1=3 趟 ， 如 下 图 所 示 。 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 
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7.11.4 多 路 合 


如 果 有 额外 的 磁带 ， 那 么 我 们 可 以 减少 将 输入 数据 排序 所 需要 的 趟 数 ， 通 过 将 基本 的 
2- 路 合并 扩充 为 全 路 合并 就 能 做 到 这 一 点 。 

两 个 顺 串 的 合并 操作 通过 将 每 一 个 输入 磁带 转 到 每 个 顺 串 的 开头 来 完成 。 然 后 ， 找 到 
较 小 的 元 素 ， 把 它 放 到 输出 磁带 上 ， 并 将 相应 的 输入 磁带 向 前 推进 。 如 果 有 上 A 盘 和 输入 磁带 ， 
那么 这 种 方法 以 相同 的 方式 工作 ， 唯 一 的 区 别 在 于 ， 它 发 现 & 个 元 素 中 最 小 的 元 素 的 过 程 
稍微 有 些 复 杂 。 我 们 可 以 通过 使 用 优先 队列 找 出 这 些 元 素 中 的 最 小 元 。 为 了 得 出 下 一 个 写 
到 磁盘 上 的 元 素 ， 我 们 进行 一 次 DeleteMin 操作 。 将 相应 的 磁带 向 前 推进 ， 如 果 在 输入 磁 
带 上 的 顺 串 尚 未 完成 ， 那 么 我 们 将 新 元 素 插入 优先 队列 中 。 仍 然 利 用 前 面 的 例子 ， 我 们 将 
输入 数据 分 配 到 三 盘 磁带 上 。 








| m | 


| Tis | 
| Ta | i£. St 94 | di 38 g 
|l oq | i2 35 96 | 15 


| Tes | 17 28 99 











此 时 ， 还 需要 两 趟 3- 路 合并 以 完成 该 排序 。 








Ta | 11] 12 17 28 35 81 94 96 99 
To | 15 41 58 75 
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在 初始 顺 串 构造 阶段 之 后 
些 顺 串 达 到 & 倍 大 小 。 


， 使 用 路 合并 所 需要 的 趟 数 为 logs (N/M)1， 因 为 每 趟 这 
对 于 上 面 的 例子 ， 公 式 成 立 ， 因 为 | log, (13/3)]=2。 如 果 我 们 有 10 
而 前 一 节 的 大 例子 需要 的 趟 数 将 是 [ log; 320 |==4。 


7.11.5 多 相合 并 


上 一 节 讨论 的 二 路 合并 方法 需要 使 用 2k 盘 磁 带 ， 
盘 磁 带 也 有 可 能 完成 排序 的 工作 。 举 个 例子 ， 我们 曾 述 只 用 三 盘 磁带 如 何 完 成 2- 路 合并 。 

设 有 三 盘 磁 带 T，、T, MT, ET 上 有 一 个 输入 文件 ， 它 将 产生 34 个 顺 串 。 一 种 选 
FEE T: MT, 的 每 一 盘 磁 带 中 放 入 17 个 顺 串 。 然 后 我 们 可 以 将 结果 合并 到 T, 上 ， 得 到 
一 盘 有 17 个 顺 串 的 磁带 。 由 于 所 有 的 顺 串 都 在 一 盘 磁 带 上 ， 因 此 我 们 现在 必须 把 其 中 的 一 
些 顺 串 放 到 T 上 以 进行 另 一 次 合并 。 执 行 合 并 的 逻辑 方式 是 将 前 8 个 顺 串 从 T, 拷贝 到 T, 
并 进行 合并 。 这 样 的 效果 是 对 于 我 们 所 做 的 每 一 趟 合并 又 附加 了 额外 的 半 趟 工作 。 

另 一 种 选择 是 把 原始 的 34 个 顺 串 不 均衡 地 分 成 两 份 。 设 我 们 把 21 个 顺 串 放 到 T. 上 而 
把 13 个 顺 串 放 到 T, E. Ria, Tk T. 用 完 之 前 将 13 个 顺 串 合并 到 T, 上 。 此 时 ， 我 们 可 以 
倒 回 磁带 T, 和 T;， 然 后 将 具有 13 个 顺 串 的 T, 和 8 个 顺 串 的 T. 合并 到 T, 上 。 此 时 ， 我 
们 合并 8 HIB ABT, 用 完 为 止 ， 这 样 ， 在 T, 上 将 留 下 5 个 顺 串 而 在 T; 上 则 有 8 个 顺 
串 。 然 后 ， 我 们 再 合并 T, 和 Ti ， 以 此 类 推 。 下 面 的 图 显示 在 每 趟 合并 之 后 每 盘 磁 带 上 的 


这 对 某 些 应 用 极为 不 便 。 只 使 用 & 十 1 
























































顺 串 的 个 数 。 
E 初始 顺 [在 T+ 本 在 Ti+ TET +T; ETC TH ET + TFET T. TETT] 
| BPR 之 局 | ZE | 2m | 2p | 产后 | 2B zh | 
nl s] t oq wg l3 1 0 1 
n m CERES: ORE ERE ae 0 D j| 9 
[5] Bj] 9 $13 158313 1£€ 153 
顺 串 最 初 的 分 配 有 很 大 的 关系 。 例 如 ,， 若 22 个 顺 串 放 在 T, b. 12 SET; 上 ， 则 第 


一 趟 合并 后 我 们 得 到 T, 上 的 12 个 顺 串 以 及 T: EK 10 个 顺 串 。 在 另 一 趟 合并 后 ， 上 有 
10 个 顺 串 而 T; 上 有 2 个 顺 串 。 此 时 ， 进 展 的 速度 慢 了 下 来 ， 因 为 在 T. 用 完 之 前 我 们 只 能 
合并 两 组 顺 串 。 这 时 Ti 有 8 个 顺 串 而 T 2 个 顺 串 。 同 样 ， 我 们 只 能 合并 两 组 顺 串 ， 结 
ET 有 6 个 顺 串 且 T; 有 2 个 顺 串 。 再 经 过 三 趟 合并 之 后 ，T: 还 有 2 个 顺 串 而 其 余 磁 带 均 
已 没有 任何 内 容 。 我 们 必须 将 一 个 顺 串 拷贝 到 另外 一 盘 磁 带 上 ， 然 后 结束 合并 。 
事实 上 ， 我 们 给 出 的 最 初 分 配 是 最 优 的 。 如 果 顺 串 的 个 数 是 一 个 斐 波 那 契 数 Fy, BBA 

分 配 这 些 顺 串 最 好 的 方式 是 把 它们 分 成 两 个 斐 波 那 契 数 下 ,和 Fwv-，*。 和 否则 ， 为 了 将 顺 串 的 
个 数 补 足 成 一 个 斐 波 那 契 数 就 必须 用 一 些 哑 顺 串 (dummy run) 来 填补 磁带 。 我 们 把 如 何 将 


一 组 初始 顺 串 分 到 磁带 上 的 具体 做 法 留 作 练习 。 

可 以 把 上 面 的 做 法 扩充 到 全 路 合并 ， 此 时 我 们 需要 & 阶 斐 波 那 契 数 用 于 分 配 顺 串 ， 其 
中 上 & 阶 韭 波 那 契 数 定义 为 FS (N) =F” (CN 一 1) 十 Fw(CN 一 2) 十 … 十 FO (CN 一 &) , 辅 以 适当 
的 初始 条 件 FOND) —0, 0O<N<k—-2, F?(k—1)—1, 


7.11.6 替换 选择 


后 我 们 将 要 考虑 的 是 顺 串 的 构造 。 迄 今 我 们 已 经 用 到 的 策略 是 所 谓 的 最 简 可 能 : 

入 尽 可 能 多 的 记录 并 将 它们 排序 ， 再 把 结果 写 到 某 个 磁带 上 。 Roseto D Reed 
理 ， 直 到 实现 只 要 第 一 个 记录 被 写 到 输出 磁带 上 ， 它 所 使 用 的 内 存 就 可 以 被 另外 的 记录 使 
用 。 如 果 输 入 磁带 上 的 下 一 个 记录 比 我 们 刚刚 输出 的 记录 大 ， 那 么 它 就 可 以 被 放 入 这 个 顺 
串 中 。 

利用 这 种 想法 ,我 们 可 以 给 出 产生 顺 串 的 一 个 算法 ， 该 方法 通常 称 为 替换 选择 (re- 
placement selection)。 开 始 ，M 个 记录 被 读 入 内 存 并 被 放 到 一 个 优先 队列 中 。 我 们 执行 一 
次 DeleteMin， 把 最 小 的 记录 写 到 输出 磁带 上 ， 再 从 输入 磁带 读 和 人 下 一 个 记录 。 如 果 它 比 
刚刚 写 出 的 记录 大 ， 那么 可 以 把 它 加 到 优先 队列 中 ， 否则， 不 能 把 它 放 入 当前 的 顺 串 。 由 
于 优先 队列 少 一 个 元 素 ， 因 此 ， 我 们 可 以 把 这 个 新 元 素 存 人 优先 队列 的 死 区 (dead space), 
直到 顺 串 完成 构建 ， 而 该 新 元 素 用 于 下 一 个 顺 串 。 将 一 个 元 素 存 人 死 区 的 做 法 类 似 于 在 堆 
排序 中 的 做 法 。 我 们 继续 这 样 的 步骤 直到 优先 队列 的 大 小 为 零 ， 此 时 该 顺 串 构建 完成 。 我 
们 使 用 死 区 中 的 所 有 元 素 通过 建立 一 个 新 的 优先 队列 开始 构建 一 个 新 的 顺 串 。 图 7-18 解释 
了 这 个 小 例子 的 顺 串 构建 过 程 ， 其 中 M 二 3。 死 元 素 以 星 号 标示 。 





























堆 数组 中 的 3 个 元 素 | 输出 读 入 的 下 一 个 元 素 
| H[0]  H[1] HQ] | 
ET Ti 94 81 11 96 
| | 81 94 96 81 12* 
| 94 96 12* 94 35* 
| | 96 35* 12* | 96 17* | 
| | 17* 35% 12* | Nubes 重 构 堆 | 
| 顺 串 2 12 35 i | 12 99 | 
17 35 99 | 17 28 | 
28 99 35 | 28 58 
35 99 58 | 35 41 | 
4l 99 $8 | 41 15* 
58 99 15* 58 磁带 的 未 端 
99 15* 99 
15* | 顺 串 的 末端 重 构 堆 | 
i | 





MURS | 15 zi 15 











图 7-18 顺 串 构建 的 例 


在 这 个 例子 中 ， 和 替换 选择 只 产生 3 个 顺 串 ， 这 与 通过 排序 得 到 5 个 顺 串 不 同 。 正 因为 
如 此 ，3- 路 合并 经 过 一 趟 而 非 两 趟 结束 。 如 果 输 入 数据 是 随机 分 配 的 ,那么 可 以 证 明 替 换 
选择 产生 平均 长 度 为 2M 的 顺 串 。 对 于 我 们 所 举 的 大 例子 ， 预 计 为 160 个 顺 串 而 不 是 320 个 
顺 串 ， 因 此 ，5- 路 合并 需要 进行 4 趟 。 在 这 个 例子 中 ,我 们 没有 节省 一 趟 ， 虽 然 在 幸运 的 


情况 下 是 可 以 节省 的 ， 我 们 可 能 有 125 个 或 更 少 的 顺 串 。 由 于 外 部 排序 花费 的 时 间 太 多 ， 
因此 节省 的 每 一 趟 都 可 能 对 运行 时 间 产 生 显著 的 影响 。 

我 们 已 经 看 到 ， 有 可 能 替换 选择 做 得 并 不 比 标准 算法 更 好 。 然 而 ， 输 入 数据 常常 从 排 
序 或 几乎 从 排序 开始 ， 此 时 替换 选择 仅仅 产生 少数 非常 长 的 顺 串 。 这 种 类 型 的 输入 通常 要 
进行 外 部 排序 ， 这 就 使 得 替换 选择 具有 特殊 的 价值 。 


Q 总 结 


对 于 最 一 般 的 内 部 排序 应 用 程序 ， 选 用 的 方法 不 是 插入 排序 、 希 尔 排序 ， 就 是 快速 排 
序 ， 它 们 的 选用 主要 是 根据 输入 的 大 小 来 决定 的 。 图 7-19 显示 了 每 个 算法 (在 一 人 台 相 对 较 














慢 的 计算 机 上 ) 处 理 各 种 不 同 大 小 的 文件 时 的 运行 时 间 。 
= a vig T 
插入 排序 | 希 尔 排序 堆 排序 快速 排序 | 快速 排序 (优化 ) 
N O(N?) O(N?5)3) | O(NlogN) | O(NlogN) | O(NlogN) 

10 | 0.000 44 0.000 41 0.000 57 0.000 52 0.000 46 

100, 0.00675 0.00171 0.004 20 0.002 84 0.002 44 

1000 | 0.59564 0.029 27 0.055 65 0.03153 0.025 87 

10000 | 58.864 0.429 98 0.716 50 0.367 65 0.31532 

100 000 NA 5.7298 8.8591 4.2298 | 3.5882 
1000 000 NA | 71.164 104.68 47.065 41.282 



































图 7-19 不 同 的 排序 算法 的 比较 (所 有 的 时 间 均 以 秒 计 ) 


选择 N 个 整数 组 成 一 些 随 机 排列 ， 而 表 中 给 出 的 各 项 仅仅 是 排序 的 实际 时 间 。 图 7-2 
给 出 的 程序 用 于 插入 排序 。 希 尔 排序 使 用 7.4 节 中 的 程序 ， 该 程序 改 为 使 用 Sedgewick 增 
量 运行 。 基 于 数 以 百 万 计 次 排序 ， 大 小 从 100 到 2 500 0000 不 等 ， 使 用 这 种 增 量 的 希 尔 排 
序 的 运行 时 间 估 计 为 O(N'”*)。 堆 排序 例 程 与 7. 5 节 中 的 相同 。 表 中 给 出 两 种 快速 排序 算 
法 。 第 一 种 使 用 简单 的 枢纽 元 方法 ， 不 进行 截止 。 幸 运 的 是 ， 这 些 输入 文件 是 随机 的 。 第 
二 种 使 用 三 数 中 值 分 割 法 ,截止 范围 为 10。 进 一 步 的 优化 还 是 有 可 能 的 。 比 如 我 们 可 以 写 
一 个 内 幅 的 三 数 中 值 例 程 而 不 是 使 用 配 数 调用 ， 也 可 以 编写 一 个 非 递归 的 快速 排序 。 还 存在 
其 他 一 些 方法 对 代码 进行 优化 ， 它 们 实现 起 来 相当 复杂 ， 当 然 ， 我们 也 可 使 用 汇编 语言 编程 。 
我 们 已 有 打算 有 效 地 编写 所 有 的 例 程 ， 不 过 ， 性 能 因 机 器 不 同 当 然 多 少 会 有 些 变 化 。 

高 度 优化 的 快速 排序 算法 即使 对 于 很 少 的 输入 数据 也 能 和 和 希 尔 排序 一 样 快 。 快 速 排序 
的 改进 算法 仍然 有 ON ) 的 最 坏 情 形 ( 有 一 个 练习 让 你 构造 一 个 小 例子 ) ， 但 是 ， 这 种 最 坏 
情形 出 现 的 机 会 微乎其微 ， 以 至 于 不 能 成 为 影响 算法 的 因素 。 如 果 需 要 对 一 些 大 型 的 文件 
排序 ， 快 速 排序 则 是 应 该 选用 的 方法 。 但 是 ， 永 远 都 不 要 图 省 事 而 轻易 把 第 一 个 元 素 用 作 
枢纽 元 。 对 输入 数据 随机 的 假设 是 不 安全 的 。 如 果 你 不 想 过 多 地 考虑 这 个 问题 ， 那 么 就 使 
用 和 希 尔 排序 。 希 尔 排序 有 些小 缺陷 ， 不 过 还 是 可 以 接受 的 ， 特 别 是 需要 简单 明了 的 时 候 。 
希 尔 排序 的 最 坏 情形 也 只 不 过 是 O(N'4)， 这 种 最 坏 情 形 发 生 的 概率 也 是 微 平 其 微 的 。 

堆 排 序 要 比 希 尔 排序 慢 ， 尽 管 它 是 一 个 带 有 了 明显 紧凑 内 循环 的 O(N log NN) 算 法 。 对 该 
算法 的 深入 考察 揭示 ， 为 了 移动 数据 ， 堆 排序 要 进行 两 次 比较 。 由 Floyd 提出 的 改进 算法 
移动 数据 基本 上 只 需要 一 次 比较 ， 不 过 实现 这 种 改进 算法 使 得 代码 多 少 要 长 一 些 。 我 们 把 
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它 留 给 读者 来 决定 这 种 附加 的 编程 代价 用 以 提高 速度 是 否 值得 ( 见 练 习 7. 40). 


插入 排序 只 用 在 小 的 或 是 非常 接近 排 好 序 的 输入 数据 上 。 我 们 没有 将 归并 排序 包括 进 


来 ， 因 为 它 的 性 能 对 于 主 存 排序 不 如 快速 排序 那么 好 ， 而 且 它 的 编程 一 点 也 不 省 事 。 然 而 
我 们 已 经 看 到 ， 合 并 却 是 外 部 排序 的 中 心思 想 。 


Q 练习 


7.1 
7.2 
7.9 


7.4 
des 


f& FHRE A REREEIE3U3, 1, 4, 1, 5, 9, 2, 6, S 排序 。 

如 果 所 有 的 关键 字 都 相等 ， 那 么 插入 排序 的 运行 时 间 是 多 少 ? 

设 我 们 交换 元 素 A[i] 和 A[i 十 k]， 它 们 最 初 是 无 序 的 。 证 明 去 掉 的 逆序 最 少 为 1 个 最 
多 为 2k 一 1 个 。 

写 出 使 用 增 量 |1，3，71} 对 输入 数据 9，8，7，6，5，4，3，2，1 运行 希 尔 排序 得 到 的 结果 。 
a. 使 用 2- 增 量 序 列 |1，2| 的 希 尔 排序 的 运行 时 间 是 多 少 ? 

b. 证 明 : 对 任意 的 N， 存 在 一 个 3- 增 量 序 列 ， 使 得 希 尔 排序 以 O(N '”) 时 间 运 行 。 

c. 证 明 : 对 任意 的 N， 存 在 一 个 6- 增 量 序列 ， 使 得 希 尔 排序 以 OCN?^ ) 时 间 运 行 。 


7.6*a. 证 明 : 使 用 形 如 1,，c,，c*，…, | 的 增 量 , 希 尔 排 序 的 运行 时 间 为 aN), 其中， 


c 为 任意 整数 。 


x*b. 证 明 : 对 于 这 些 增 量 ， 平 均 运 行 时 间 为 ON). 


x7.7 


证 明 : EA HEFa A- HERR, MWEE 二 排序 的 。 


x*7.8 证 明 : 使 用 由 Hibbard 建议 的 增 量 序列 的 希 尔 排 序 在 最 坏 情 形 下 的 运行 时 间 是 
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7.9 


7. 10 


Dokl 


4. 12 


F183 


7. 14 
715 


Q(N*7),3& x. 可 以 证 明 当 所 有 的 元 素 不 是 0 就 是 1 时 希 尔 排序 这 种 特殊 情形 的 时 间 
Fo MRi nIDAXRO A, hoi, 8, hgepa RERA, WRITE InputData[i]— 1, 
否则 置 为 0。 

确定 希 尔 排序 对 于 下 述 输入 的 运行 时 间 : 

a. 排 过 序 的 输入 数据 。 


xb. 有 反 序 排列 的 输入 数据 。 


下 述 两 种 对 图 7-4 所 编写 的 希 尔 排 序 例 程 的 修改 影响 最 坏 情 形 的 运行 时 间 吗 ? 
a. 如 果 Increment 是 偶数 ， 则 在 第 2 行 前 将 Increment Wl. 

b. 如 果 Increment 是 偶数 ， 则 在 第 2 行 前 将 Increment 加 1。 

指出 堆 排 序 如 何 处 理 输入 数据 142, 543, 123, 65, 453, 879, 572, 434, 111, 
242, 811, 1025 

a. 对 于 预 排序 的 输入 数据 ， 堆 排序 的 运行 时 间 是 多 少 ? 

xb. 证 明 : 堆 排 序 的 最 坏 情形 的 界 是 可 以 达到 的 。 

用 归并 排序 将 3，1， 4, 1, 5, 9, 2, 6 排序 。 

不 使 用 递归 如 何 实现 归并 排序 ? 

确定 对 下 列 数据 进行 归并 排序 的 运行 时 间 : 

a. 排 过 序 的 输入 数据 。 

b. 反 序 排列 的 输入 数据 。 


7.21 
7.22 


7.27 
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c. 随机 的 输入 数据 。 

在 归并 排序 的 分 析 中 是 不 考虑 常数 的 。 证 明 : 归并 排序 在 最 坏 情 形 下 用 于 比较 的 次 
数 为 N[ log N 1 一 2 +1, 

用 三 数 中 值 分 割 法 以 及 截止 为 3 的 快速 排序 对 3, 1, 4, 1, 5, 9, 2, 6, 5, 3,5 

排序 。 

使 用 本 章 中 的 快速 排序 实现 方法 确定 下 列 输入 数据 的 快速 排序 运行 时 间 : 

a， 排 过 序 的 输入 数据 。 

b. 反 序 排列 的 输入 数据 。 

c. 随机 的 输入 数据 。 

当 将 下 列 元素 选 作 枢纽 元 时 重 做 练习 7. 18: 

& B—TSItR. 

b. 前 两 个 互 异 关键 字 中 的 较 大 者 。 

c. 一 个 随机 元 素 。 

xd. 在 该 输入 集合 中 所 有 关键 字 的 平均 值 。 

a. 对 于 本 章 中 快速 排序 的 实现 方法 ， 当 所 有 的 关键 字 都 相等 时 它 的 运行 时 间 是 多 少 ? 

b. 假设 我 们 改变 分 割 策略 使 得 找到 一 个 与 枢纽 元 相同 的 关键 字 时 i 和 j 都 不 停止 。 当 
所 有 的 关键 字 都 相等 时 ， 为 了 保证 快速 排序 正常 工作 ， 需 要 对 程序 做 哪些 修改 ? 
,运行 时 间 是 多 少 ? 

c. 假设 我 们 改变 分 割 策略 使 得 在 一 个 与 枢纽 元 相同 的 关键 字 处 i 停止 ,但 是 j 在 类 似 
的 情形 下 却 不 停止 。 为 了 保证 快速 排序 正常 工作 ， 需 要 对 程序 做 哪些 修改 ? 当 所 
有 的 关键 字 都 相等 时 ， 快 速 排序 的 运行 时 间 是 多 少 ? 

设 我 们 选择 中 间 的 关键 字 作 为 枢纽 元 。 这 是 否 使 得 快速 排序 将 不 可 能 需要 二 次 时 间 ? 

构造 20 个 元 素 的 一 个 排列 ， 使 得 对 于 三 数 中 值 分 割 且 截 止 为 3 的 快速 排序 ， 该 排列 

尽 可 能 差 。 

编写 一 个 程序 实现 选择 算法 。 


求解 下 列 递 推 关系 : TIN) = (1/N)[ S TG)] +N ,T(0) = 0。 


如 果 一 切 具 有 相等 关键 字 的 元 素 都 保持 它们 在 输入 数据 时 呈现 的 顺序 ， 那 么 这 种 排序 
算法 就 是 稳定 的 (stable)。 本 章 中 的 排序 算法 哪些 是 稳定 的 ?哪些 不 是 ?为 什么 ? 

设 给 定 N 个 排 过 序 的 元 素 ， MERA f(NN) 个 随机 顺序 的 元 素 。 如 果 AN) 是 下 列 情 
况 ， 那 么 如 何 将 全 部 数据 排序 ? 

a. f(N)=0(1) 

b. f(N)=O(log N) 

c. f(N)=O( VN) 

*d， 帮 CN) 多 大 使 得 全 部 数据 仍然 能 够 以 O(N) 时 间 排 序 ? 

证 明 : 在 NN 个 元 素 排 过 序 的 表 中 找 出 一 个 元 素 X 的 任何 算法 都 需要 0Q (log N) 次 
比较 。 
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7. 28 


利用 Stirling 公式 N! ^(N /e)" V2xrN 给 出 log (NI 的 精确 估计 。 


7.29 x a. 两 个 排 过 序 的 含有 NN 个 元 素 的 数组 有 多 少 种 合并 的 方法 ? 


M 


. 30 


7.31 


7.40 


xb. 给 出 合并 两 个 含有 个 元 素 的 排 过 序 的 数组 所 需要 的 比较 次 数 的 非 平 凡 下 界 。 
证 明 : 使 用 桶 式 排序 把 具有 范围 在 1] 委 key 科 M 内 的 整数 关键 字 的 N 个 元 素 排序 需 
要 时 间 O(M 十 NN)。 
KAN 个 元 素 的 数组 只 包含 两 个 不 同 的 关键 字 true 和 false。 给 出 一 个 O(N) 算 
法 ， 重 新 排列 这 些 元 素 使 得 所 有 false 的 元 素 都 排 在 true 的 元 素 的 前 面 。 你 只 能 
使 用 常数 附加 空间 。 
设 有 N 个 元 素 的 数组 包含 三 个 不 同 的 关键 字 true, false 和 maybe。 给 出 一 个 
O(CN) 算 法 ， 重 新 排列 这 些 元 素 ， 使 得 所 有 false 的 元 素 都 排 在 maybe 的 元 素 的 前 
H, mM maybe 的 元 素 都 在 crue 的 元 素 的 前 面 。 你 只 能 使 用 常数 附加 空间 。 
a. 证 明 : 任何 基于 比较 的 算法 将 4 个 元 素 排序 均 需 5 次 比较 。 
b. 给 出 一 种 算法 用 5 次 比较 将 4 个 元 素 排 序 。 
a. 证 明 : 使 用 任何 基于 比较 的 算法 将 5 个 元 素 排序 都 需要 7 次 比较 。 

xb. 给 出 一 个 算法 用 7 次 比较 将 5 个 元 素 排 序 。 
写 出 一 个 有 效 的 希 尔 排序 算法 并 比较 使 用 下 列 增 量 序列 时 的 性 能 : 
a. 希 尔 的 原始 序列 。 
b. Hibbard 的 增 量 。 


c. Knuth 的 增 量 : hh 一 地 (3' 十 1)。 


hr 
Lee 


d. Gonnet 的 增 量 . .=| | ! ifti Ae =| 

e. Sedgewick 增 量 。 

实现 优化 的 快速 排序 算法 并 用 下 列 组 合 进行 实验 : 

a KAT: 第 一 个 元 素 ， 中 间 的 元 素 ， 随 机 的 元 素 ， 三 数 中 值 ， 五 数 中 值 。 

b. 截止 值 从 0 到 20。 

编写 一 个 例 程 读 和 人 两 个 用 字母 表示 的 文件 并 将 它们 合并 到 一 起 ， 形 成 第 三 个 也 是 用 

字母 表示 的 文件 。 

设 我 们 实现 三 数 中 值 例 程 如 下 : 找 出 ALDeft]、A[center] 和 ALRight] 的 中 值 ， 

并 将 它 与 AL[LRight ] 交 换 。 以 通常 的 分 割 方法 进行 ， 开始 时 i 在 Left 处 且 j 在 

Right 一 1 处 (而 不 是 Left 十 1 和 Right 一 2)。 

a. 设 输入 为 2，3,，4，…，N 一 1]1，N，1。 对 于 该 输入 ， 这 种 快速 排序 算法 的 运行 时 
间 是 多 少 ? 

b. 设 输入 数据 呈 反 序 排列 ， 对 于 该 输入 ， 这 种 快速 排序 算法 的 运行 时 间 又 是 多 少 ? 

证 明 : 任何 基于 比较 的 排序 算法 都 需要 平均 Q(N log N) 次 比较 。 

考虑 下 面 的 PercolateDown 算法 。 我 们 在 节点 X 处 有 一 个 空 穴 (hole)。 普 通 的 例 程 是 

比较 X 的 儿子 然后 把 比 我 们 将 要 放置 的 元 素 大 的 儿子 上 移 到 X 处 (在 max 堆 的 情形 





GS n. —2 9 Ay =1). 
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下 )， 由 此 将 空 穴 下 推 ， 当 把 新 元 素 安全 放 到 空 穴 中 时 终止 算法 。 另 一 种 方法 是 将 元 素 
上 移 且 空 穴 尽 可 能 地 下 移 ， 不 用 测试 是 否 能 够 插入 新 单元 。 这 将 使 得 新 单元 被 放置 到 
一 片 树叶 上 并 可 能 破坏 堆 序 。 为 了 修复 堆 序 ， 以 通常 的 方式 将 新 单元 上 滤 。 写 出 包含 
该 想法 的 例 程 ， 并 与 标准 的 堆 排 序 实现 方法 的 运行 时 间 进 行 比较 。 

7.41 提出 一 种 算法 ， 只 用 两 盘 磁 带 对 一 个 大 型 文件 进行 排序 。 

7.42 a. 通过 建 堆 (build-heap) 最 多 使 用 2N 次 比较 的 事实 推出 堆 个 数 的 下 界 N1 /2°%,, 
b. 利用 Stirling 公式 扩展 该 界 。 

7.43 ANSIC 要 求 例 程 qsort 出 现在 C 函数 库 中 。qsort 由 快速 排序 典型 算法 实现 (但 这 
不 是 必需 的 ) 。 通 过 各 种 输入 数据 进行 实验 观察 是 否 asort 能 够 出 现 二 次 的 特性 。 
用 一 些 随机 的 0 和 1 测试 。 
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在 这 一 章 ， 我 们 描述 解决 等 价 问题 的 一 种 有 效 数 据 结构 。 这 种 数据 结构 实现 简单 ， 每 
个 例 程 只 需要 几 行 代码 ， 而 且 可 以 使 用 一 个 简单 的 数组 。 它 的 实现 也 非常 快 ， 每 种 操作 只 
需要 常数 平均 时 间 。 从 理论 上 看 ， 这 种 数据 结构 还 是 非常 有 趣 的 ， 因 为 它 的 分 析 极 其 困难 ， 
最 坏 情况 的 函数 形式 不 同 于 我 们 已 经 见 过 的 任何 形式 。 对 于 这 种 不 相交 集 ADT， 我 们 将 : 

e 讨论 如 何 能 够 以 最 少 的 编程 代价 实现 。 

e 通过 两 个 简单 的 观察 极 大 地 增加 它 的 速度 。 

e 分 析 一 种 快速 实现 方法 的 运行 时 间 。 

e 介绍 一 个 简单 的 应 用 。 


8.1 等 价 关系 


若 对 于 每 一 对 元 素 (a, b), a, BES, aRb 或 者 为 true 或 者 为 false， 则 称 在 集合 S 
上 定义 关系 (relation)R。 如 果 aRb 是 true, MARIK a 与 5 有 关系 。 

等 价 关系 (equivalence relation) 是 满足 下 列 三 个 性 质 的 关系 R: 

1.( 自 反 性 ) 对 于 所 有 的 a€ S. aRa。 

2. (对 称 性 )aRb 当 且 仅 当 bRa。 

3. (传递 性 ) 若 aRb B. bRc 则 aRc。 

我 们 将 考虑 几 个 例子 。 

关系 “<” 不 是 等 价 关系 。 SUITE LSU CN a <a) ， 可 传递 的 ( 即 由 aco 和 65<e 得 
出 ae 委 c)， 但 它 却 不 是 对 称 的 ， 因 为 从 aso IFA ETS ba, 

电气 连接 (electrical connectivity) 是 一 个 等 价 关 系 ， 其 中 所 有 的 连接 都 是 通过 金属 导线 
完成 的 。 该 关系 显然 是 自 反 的 ， 因 为 任何 元 件 都 是 自身 相连 的 。 如 果 a 电气 连接 到 5， 那 么 
b 必然 也 电气 连接 到 a。 最 后 ， 如 果 a 连接 到 5b， 而 5 又 连接 到 c， 那 么 a 连接 到 c。 因 此 ， 
电气 连接 是 一 个 等 价 关 系 。 

如 果 两 个 城市 位 于 同一 个 国家 ， 那 么 定义 它们 是 有 关系 的 。 容 易 验 证 这 是 一 个 等 价 关 
系 。 如 果 能 够 通过 公路 从 城镇 a TBO, Wika 与 4 有 关系 。 如 果 所 有 的 道路 都 是 双向 行 
驶 的 ， 那 么 这 种 关系 也 是 一 个 等 价 关 系 。 


8.2 动态 等 价 性 问题 


给 定 一 个 等 价 关系 “一 ”， 一 个 自然 的 问题 是 对 任意 的 a 和 2， 确 定 是 否 ab. MRK 
等 价 关系 存储 为 一 个 二 维 布尔 数组 ， 那 么 当然 这 个 工作 可 以 以 常数 时 间 完 成 。 问 题 在 于 ， 
这 种 关系 的 定义 通常 不 明显 而 是 相当 隐秘 的 。 

作为 一 个 例子 ， 设 在 5 个 元 素 的 集合 {a1 ，as;，a;，as，a;} 上 定义 一 个 等 价 关 系 。 此 时 
存在 25 对 元 素 ， 其 中 每 一 对 或 者 有 关系 或 者 没有 关系 。 然 而 ,信息 ai ~a aca 
As ~a sa, ~a: 意味 着 每 一 对 元 素 都 是 有 关系 的 。 我 们 希望 能 够 迅速 推断 出 这 些 关 系 。 

一 个 元 素 a€ S 的 等 价 类 (equivalence clas) Æ S 的 一 个 子 集 ， 它 包含 所 有 与 a 有 关系 的 元 
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素 。 注 意 ， 等 价 类 形成 对 S 的 一 个 划分 : S 的 每 一 个 成 员 恰好 出 现在 一 个 等 价 类 中 。 为 确定 是 
Marb, RIR TUE a 和 4 是否 都 在 同一 个 等 价 类 中 。 这 给 我 们 提供 了 解决 等 价 问题 的 方法 。 

输入 数据 最 初 是 N 个 集合 的 类 (collection) ， 每 个 集合 含有 一 个 元 素 。 初 始 的 描述 是 所 
有 的 关系 均 为 false( 自 反 的 关系 除外 )。 每 个 集合 都 有 一 个 不 同 的 元 素 ， 从 而 SNSD; 
这 使 得 这 些 集合 不 相交 (disjoint) 。 

此 时 ， 有 两 种 运算 允许 进行 。 第 一 种 运算 是 Find， 它 返回 包含 给 定 元 素 的 集合 ( 即 等 价 类 ) 的 
名 字 。 第 二 种 运算 是 添加 关系 。 如 果 想 要 添加 关系 < 一 2"， 那 么 我 们 首先 要 看 是 否 c 和 4 已 经 有 关 
系 。 这 可 以 通过 对 a Al b PUT Find 并 检验 它们 是 否 在 同一 个 等 价 类 中 来 完成 。 如 果 它 们 不 在 同一 
类 中 ,那么 我 们 使 用 求 并 运算 Union， 这 种 运算 把 含有 a Mo 的 两 个 等 价 类 合并 成 一 个 新 的 等 价 类 。 
从 集合 的 观点 来 看 ，U 的 结果 是 建立 一 个 新 集合 S, —S US;， 去 掉 原 来 两 个 集合 而 保持 所 有 的 集 
合 的 不 相交 性 。 由 于 这 个 原因 ， 常 常 把 做 这 项 工作 的 算法 叫 作 不 相交 集合 的 Union/Find X. 

该 算法 是 动态 的 (dynamic)， 因 为 在 算法 执行 的 过 程 中 ,集合 可 以 通过 Union 运算 发 
生 改变 。 这 个 算法 还 必然 是 联机 (on-line) 操 作 ， 当 Find 执行 时 ， 它 必须 给 出 答案 算法 才能 
继续 进行 。 男 一 种 可 能 是 脱 机 (off-line) 算 法 : 该 算法 需要 观察 全 部 的 Union Al Find 序列 。 
EME Find 给 出 的 答案 必须 和 所 有 执行 到 该 Fina 的 Union 一 致 ， 而 该 算法 在 看 到 所 
有 的 问题 以 后 再 给 出 它 的 所 有 的 答案 。 这 种 差别 类 似 于 参加 一 次 笔试 ( 它 一 般 是 脱 机 的 一 一 
尔 只 能 在 规定 的 时 间 用 完 之 前 给 出 答卷 ) 和 一 次 口试 ( 它 是 联机 的 ， 因 为 你 必须 回答 当前 的 
问题 ， 然 后 才能 继续 下 一 个 问题 ) 。 

注意 我们 不 进行 任何 比较 元 素 相关 的 值 的 操作 ， 而 是 只 需要 知道 它们 的 位 置 。 由 于 
这 个 原因 ， 我 们 假设 所 有 的 元 素 均 已 从 1 到 N 顺序 编号 并 且 编 号 方法 容易 由 某 个 散 列 方案 
确定 。 于 是 ， 开 始 时 我 们 有 S=}, i=1 到 N. 

我 们 的 第 二 个 观察 是 ， 由 Pind 返回 的 集合 的 名 字 实 际 上 是 相当 任意 的 。 真 正 重要 的 
关键 在 于 : Find(a) 二 Find(5) 当 上 且 仅 当 a 和 2 在 同一 个 集合 中 。 

这 些 运算 在 许多 图 论 问题 中 是 重要 的 ， 在 一 些 处 理 等 价 (或 类 型 ) 声 明 的 编译 程序 中 也 
很 重要 。 我 们 将 在 后 面 讨论 一 个 应 用 。 

解决 动态 等 价 问题 的 方案 有 两 种 。 一 种 方案 保证 指令 Fina 能 够 以 常数 最 坏 情形 运行 
时 间 执 行 ， 而 另 一 种 方案 则 保证 指令 Union 能 够 以 常数 最 坏 情 形 运行 时 间 执 行 。 最 近 有 人 
指出 二 者 不 能 同时 做 到 。 

我 们 将 简要 讨论 第 一 种 处 理 方法 。 为 使 Find 运算 快 ， 可 以 在 一 个 数组 中 保存 每 个 元 
素 的 等 价 类 的 名 字 。 此 时 ，Fing 就 是 简单 的 O(1) 查 找 。 设 我 们 想 要 执行 Union(a, b), 
并 设 a 在 等 价 类 i 中 而 4 在 等 价 类 ;7 中 。 然 后 我 们 扫描 该 数组 ， 将 所 有 的 i 变 成 ;。 不 过 ， 
这 次 扫描 要 花费 8(N) 时 间 。 于 是 ， 连 续 N 一 1 次 Union 操作 (这 是 最 大 值 ， 因 为 此 时 每 个 
元 素 都 在 一 个 集合 中 ) 就 要 花费 ON ANE Tal, WER AEE Q(N?) 次 Fina 运算 ,那么 性 能 会 
很 好 ， 因 为 在 整个 算法 执行 过 程 中 每 个 Find 或 Union 运算 的 总 的 运行 时 间 为 O(1)。 如 果 
Find 运算 没有 那么 多 ， 那 么 这 个 界 是 不 可 接受 的 。 

一 种 想法 是 将 所 有 在 同一 个 等 价 类 中 的 元 素 放 到 一 个 链表 中 。 这 在 更 新 的 时 候 会 节省 
时 间 ， 因 为 我 们 不 必 搜 索 整 个 数组 。 但 是 由 于 它 在 算法 过 程 中 仍然 可 能 执行 9(N? ) 次 等 价 
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类 的 更 新 ， 因 此 它 本 身 并 不 能 单独 减少 渐 近 运行 时 间 。 

如 果 我 们 还 要 跟踪 每 个 等 价 类 的 大 小 ， 并 在 执行 Union 时 将 较 小 的 等 价 类 的 名 字 改 成 
较 大 的 等 价 类 的 名 字 ， 那 么 对 于 N 一 1 次 合并 的 总 的 时 间 开 销 为 O(N log N)。 其 原因 在 于 ， 
每 个 元 素 可 能 将 它 的 等 价 类 最 多 改变 log N 次 ， 因 为 每 次 它 的 等 价 类 改变 时 新 的 等 价 类 至 
少 是 原来 等 价 类 的 两 们 大。 使 用 这 种 方法 ,任意 顺序 的 M 次 Find 和 最 多 N 一 1 次 的 
Union 最 多 花费 O(M 十 N log N) 时 间 。 

在 本 章 的 其 余部 分 ， 我们 将 考察 Union/Find 问题 的 一 种 解法 ， 其 中 union 运算 容易 
但 Find 运算 要 难 一 些 。 即 使 如 此 ， 任意 顺序 的 最 多 M 次 Fina 和 最 多 N—1 次 Union 的 
运行 时 间 将 只 比 OC(M 十 NN) 多 一 点 。 


8.3 基本 数据 结构 


记 住 ， 我 们 的 问题 不 要 求 Pina 操作 返回 任何 特定 的 名 字 ， 而 只 是 要 求 当 且 仅 当 两 个 
元 素 属 于 相同 的 集合 时 ， 作 用 在 这 两 个 元 素 上 的 Find 返回 相同 的 名 字 。 一 种 想法 是 可 以 
使 用 树 来 表示 每 一 个 集合 ， 因 为 树 上 的 每 一 个 元 素 都 有 相同 的 根 。 这 样 ， 该 根 就 可 以 用 来 
命名 所 在 的 集合 。 我 们 将 用 树 表示 每 一 个 集合 。( 记 住 ， 树 的 集合 叫 作 森林 。) 开 始 时 每 个 集 
合 含有 一 个 元 素 。 我 们 将 要 使 用 的 这 些 树 不 一 定 必 须 是 二 又 树 ， 但 是 其 表示 要 容易 ， 因 为 
我 们 需要 的 唯一 信息 就 是 一 个 父 指针 。 集 合 的 名 字 由 根 处 的 节点 给 出 。 由 于 只 需要 父 节 点 
的 名 字 ， 因 此 我 们 可 以 假设 树 被 非 显 式 地 存储 在 一 个 数组 中 : 数组 的 每 个 成 员 P[i 表 示 元 
X i 的 父亲 。 如 果 i 是 根 ， 那 么 PDi]—0. ÆR 8-1 的 森林 中 ， 对 于 08. P[i]—0. E 
如 在 堆 中 那样 ， 我 们 也 将 显 式 地 画 出 这 些 树 ， 注 意 ， 此 时 正在 使 用 一 个 数组 。 图 8-1 表达 
了 这 种 显 式 的 表示 方法 ， 为 方便 起 见 ， 我 们 将 把 根 的 父 指针 垂直 画 出 。 
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图 8-1 八 个 元 素 ， 最初 是 在 不 同 的 集合 上 
为 了 执行 两 个 集合 的 Union 运算 ， 我 们 使 一 个 节点 的 根 指针 指向 另 一 棵 树 的 根 节点 。 
显然 ， 这 种 操作 花费 常数 时 间 。 图 8-2、8-3 和 8-4 分 别 表示 在 Union(5，6) Union(7. 8) 
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图 8-2 在 Union(5，6) 之 后 
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8-3 在 Union(7，8) 之 后 
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和 Union(5，7) 后 的 森林 ， 其 中 ， 我们 采纳 了 在 Union(X，Y) 后 新 的 根 是 X 的 约定 。 最 后 
的 森林 的 非 显 式 表 示 见 图 8-5 。 
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图 8-4 在 Union(5，7) 之 后 


对 元 素 X 的 一 次 Find(X) 操 作 通 过 返回 
包含 X 的 树 的 根 而 完成 。 执 行 这 次 操作 花费 的 
时 间 与 表示 X 的 节点 的 深度 成 正比 ， 当 然 这 要 
假设 我 们 以 常数 时 间 找 到 表示 X 的 节点 。 使 用 
上 面 的 方法 ， 能 够 建立 一 棵 深度 为 N 一 1 的 树 ， 使 得 一 次 Find 的 最 坏 情 形 运行 时 间 是 
O(N) 一般 情况 下 ， 运 行 时 间 是 对 连续 混合 使 用 M 个 指令 来 计算 的 。 在 这 种 情况 下 ，M 次 
连续 操作 在 最 坏 情形 下 可 能 花费 OCMN) 时 间 。 

图 8-6 到 图 8-9 中 的 程序 表示 基本 算法 的 实现 ， 假 设 差错 检验 已 经 执行 。 在 我 们 的 例 程 
中 ， 这 些 Union 是 在 这 些 树 的 根 上 进行 的 。 有 时 候 通 过 传递 任意 两 个 元 素来 执行 运算 ， 并 
使 得 Unioh 执 行 两 次 Fina 以 确定 这 些 根 。 
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8-5 上 面 的 树 的 非 显 式 表示 





#ifndef _DisjSet_H 


typedef int DisjSet[ NumSets + 1 ]; 
typedef int SetType; 
typedef int ElementType; 


void Initilialize( DisjSet S ); 
void SetUnion( DisjSet S, SetType Rootl, SetType Root2 ); 
SetType Find( ElementType X, DisjSet S ); 


#endif /* _DisjSet_H */ 











图 8-6 不 相交 集合 的 类 型 声明 
平均 时 间 分 析 是 相当 困难 的 。 最 起 码 的 问题 是 答 
案 依赖 于 如 何 定义 (对 Union 操作 而 言 的 ) 平 均 。 例 | 
如 ， 在 图 8-4 的 森林 中 ,我们 可 以 说 ， 由 于 有 5 棵 | 
树 ， 因 此 下 一 个 Union 就 存在 5. 4—20 个 等 可 能 的 for( i = NumSets; i > 0; i-- ) 
结果 (因为 任意 两 棵 不 同 的 树 都 可 能 被 Union). ^ | he Tas 
然 ， 这 个 模型 的 含义 在 于 ， 只 存在 名 的 机 会 使 得 下 一 mur 不 相交 集 的 初始 化 例 和 
次 Union 涉及 大 树 。 另 一 种 模型 可 能 会 认为 ， 在 不 同 的 树 上 任意 两 个 元 素 间 的 所 有 Union 
都 是 等 可 能 的 ， 因 此 大 树 比 小 树 更 有 可 能 在 下 一 次 Union 中 涉及 。 在 上 面 的 例子 中 ， 48i 


的 机 会 大 树 在 下 一 次 Union 中 涉及 ， 因 为 (忽略 对 称 性 ) 存 在 6 种 方法 合并 {1，2，3，4} 中 





void 
Initialize( DisjSet S) 
{ 


int 1; 
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的 两 个 元 素 以 及 16 种 方法 将 和 15，6，7，8}) 中 的 一 个 元 素 与 {1，2，3，4}) 中 的 一 个 元 素 合 
并 。 还 存在 更 多 的 模型 ， 而 在 何者 为 最 好 的 问题 上 没有 广泛 一 致 的 见解 。 平 均 运行 时 间 依 
赖 于 模型 ， 对 于 三 种 不 同 的 模型 ， 时 间 界 OCM), OM log N) 以 及 OMN) XR EE AHE 
Hj. 不过， 最 后 的 那个 界 更 现实 些 。 


























/* Assumes Rootl and Root2 are roots */ 
/* union is a C keyword, so this routine */ SetType 
/* is named SetUnion */ Find( ElementType X, DisjSet S ) 
1 
void ife SEX] <= 0) 
SetUnion( DisjSet S, SetType Rootl, SetType Root2 ) return X; 
else 
SE Root2 J = Root1; return Find( SE X], S ) 
} } 
Al 8-8 Union( 不 是 最 好 的 方法 ) 图 8-9 一 个 简单 的 不 相交 集 的 Find 算法 


对 一 系列 操作 而 言 ， 二 次 (quadratic) 运 行 时 间 一 般 是 不 可 接受 的 。 可 幸 的 是 ， 有 几 种 
方法 容易 保证 这 样 的 运行 时 间 不 会 出 现 。 


8.4 灵巧 求 并 算法 


上 面 的 Union 的 执行 是 相当 任意 的 ， 它 通过 使 第 二 棵 树 成 为 第 一 棵 树 的 子 树 而 完成 合 
并 。 对 其 进行 简单 改进 是 借助 任意 的 方法 打破 现 有 关系 ， 使 得 总 让 较 小 的 树 成 为 较 大 的 树 
的 子 树 ; 我 们 把 这 种 方法 叫 作 按 大 小 求 并 (union-by-size)。 前 面 例子 中 三 a Union 的 对 象 
大 小 都 是 一 样 的 ， 因 此 我 们 可 以 认为 它们 都 是 按照 大 小 执行 的 。 假 如 下 一 次 运算 是 Union 
(4，5)， 那 么 结果 将 形成 图 8-10 中 的 森林 。 倘 若 没有 对 大 小 进 nfi nM pa Union. Hf 
么 结果 将 会 形成 更 深 的 树 ( 见 图 8-11). 


t £ 4 2 
/ Y / \ / \ 
V x F. p^ 2 ) \ 人 J poo 


图 8-11 进行 一 次 任意 的 并 的 结果 
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我 们 可 以 证 明 ， 如 果 这 些 union 都 是 按照 大 小 进行 的 ,那么 任何 节点 的 深度 均 不 会 超 
log N。 为 此 ， 首 先 注意 节点 初始 处 于 深度 0 的 位 置 。 当 它 的 深度 随 着 一 次 Union 的 结果 
而 增加 的 时 候 ， 该 节点 则 被 置 于 至 少 是 它 以 前 所 在 树 两 倍 大 的 一 棵 树 上 。 因 此 ， 它 的 深度 
最 多 可 以 增加 log N。( 我 们 在 8.2 节 末 尾 的 快速 查找 算法 中 用 过 这 个 论断 。) 这 意味 着 ， 
Find 操作 的 运行 时 间 是 O(log N) ， 而 连续 M 次 操作 则 花费 OCM log ND. [8 8-12 中 的 树 
指出 在 16 次 Union 后 有 可 能 得 到 这 种 最 坏 的 树 ， 而 且 如 果 所 有 的 Union 都 对 相等 大 小 的 
树 进 行 ， 那 么 这 样 的 树 是 会 得 到 的 (最 坏 情形 的 树 是 在 第 6 章 讨论 过 的 二 项 树 ) 。 


T) 
23) GL ——($ 
CR Wax M ae 
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Q 
图 8-12 N=16 时 最 坏 情形 的 树 
为 了 实现 这 种 方法 ， 我们 需要 记 住 每 一 棵 树 的 大 小 。 由 于 我 们 实际 上 只 使 用 一 个 数组 ， 
因此 可 以 让 每 个 根 的 数组 元 素 包含 它 的 树 的 大 小 的 负 值 。 这 样 一 来 ， 初 始 时 树 的 数组 表示 
就 都 是 一 1 了 (而 图 8-7 则 需要 进行 相应 的 改变 ) 。 当 执行 一 次 Union 时 ， 要 检查 树 的 大 小 ; 
新 的 大 小 是 老 的 大 小 的 和 。 这 样 ， 按 大 小 求 并 的 实现 根本 不 存在 困难 ， 并 且 不 需要 额外 的 
空间 ， 其 速度 平均 来 说 也 很 快 。 对 于 几乎 所 有 合理 的 模型 ， 业 已 证 明 若 使 用 按 大 小 求 并 则 
连续 M 次 运算 需要 O(M) 平 均 时 间 。 这 是 因为 当 随 机 的 诸 Union 执行 时 整个 算法 一 般 只 有 
一 些 很 小 的 集合 (通常 含 一 个 元 素 ) 与 大 集合 合 
男 一 种 实现 方法 为 按 高 度 求 并 (union-by-height)， 它 同样 保证 所 有 的 树 的 深度 最 多 是 
O(log N)。 我 们 跟踪 每 棵 树 的 高 度 而 不 是 大 小 并 执行 那些 Union 使 得 浅 的 树 成 为 深 的 树 的 
子 树 。 这 是 一 种 平缓 的 算法 ， 因 为 只 有 当 两 棵 相等 深度 的 树 求 并 时 树 的 高 度 才 增加 (此 时 树 
的 高 度 增 1) 。 这 样 ， 按 高 度 求 并 是 按 大 小 求 并 的 简单 修改 。 
下 列 各 图 显示 一 棵 树 以 及 它 对 于 按 大 小 求 并 和 按 高 度 求 并 的 非 显 式 表示 。 图 8-13 中 的 
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8-13 ” 按 高 度 ( 秩 ) 求 并 的 程序 
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216 数据 结构 与 ka C 语言 描述 








| /* Assume Rootl and Root2 are roots */ 
/* union is a C keyword, so this routine */ 
/* is named SetUnion */ 


void 
SetUnion( DisjSet S, SetType Rootl, SetType Root2 ) 


ifC S[ Root2 ] < S[ Rootl ] ) /* Root2 is deeper set */ 
S[ Rootl ] = Root2; /* Make Root2 new root */ 
else 


ifC S[ Rootl ] == S[ Root2 ] ) /* Same height, */ 
S[ Rootl ]--; /* so update */ 
S[ Root2 ] = Rootl; 











程序 实现 的 是 按 高 度 求 并 的 代码 。 


8.5 路 径 压 缩 


迄今 所 描述 的 Union/Find 算法 对 于 大 多 数 情 形 都 是 完全 可 接受 的 ， 它 是 非常 简单 的 ， 
而 且 对 于 连续 M 个 指令 (在 所 有 的 模型 下 ) 平 均 是 线性 的 。 不 过 ，O(M log N) 的 最 坏 情 形 还 
是 可 能 相当 容易 并 自然 发 生 的 。 例 如 ， 如 果 把 所 有 的 集合 放 到 一 个 队列 中 并 重复 地 让 前 两 
个 集合 出 队 而 让 它们 的 并 入 队 ， 那 么 最 坏 的 情形 就 会 发 生 。 如 果 运 算 Find Hb union 多 很 
多 ,那么 其 运行 时 间 就 比 快速 查找 算法 的 运行 时 间 要 糟 。 而 且 应 该 清楚 ， 对 于 Union 算法 
恐怕 没有 更 多 改进 的 可 能 。 这 是 基于 这 样 的 观察 : 执行 Union 操作 的 任何 算法 都 将 产生 相 
同 的 最 坏 情形 的 树 ， 因 为 它 必 然 会 随意 打破 树 间 的 均衡 。 因 此 ， 无 须 对 整个 数据 结构 重新 
加 工 而 使 算法 加 速 的 唯一 方法 是 对 rina 操作 做 些 更 聪明 的 工作 。 

这 种 聪明 的 操作 叫 作 路 径 压 缩 Cpath compression) 。 路 径 压 缩 在 一 次 Fina 操作 期 间 执 
行 ， 而 与 用 来 执行 Union 的 方法 无 关 。 设 操作 为 Finda(CX)， 此 时 路 径 压 缩 的 效果 是 ， 从 X 
到 根 的 路 径 上 的 每 一 个 节点 都 使 它 的 父 节 点 变 成 根 。 图 8-14 指出 在 对 图 8-12 的 最 坏 情 形 的 
树 执行 Fina(15) 后 压缩 路 径 的 效果 。 


1 ag —— — 
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图 8-14 路 径 压 缩 的 一 个 例子 


路 径 压 缩 的 实施 在 于 使 用 额外 的 两 次 指针 移动 ， 贡 点 13 和 14 现在 离 根 近 了 一 个 位 置 ， 
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而 节点 15 和 16 现在 离 根 近 了 两 个 位 置 。 因 此 ， 对 这 些 节点 未 来 的 快速 存 取 将 付出 额外 的 
工作 来 进行 路 径 压 缩 。 

如 图 8-15 所 示 ， 路 径 压 缩 对 基本 的 Find = ] 
操作 改变 不 大 。 对 Find 例 程 来 说 ， 唯 一 的 变 | 站 CelenentType X, Disjset s ) 
化 是 使 得 SLX IEF Find 返回 的 值 ; 这 样 ， ; if( SEX] <0) 








在 集合 的 根 被 递归 地 找到 以 后 ，X 就 直接 指向 ae X; 
它 。 对 通 向 根 的 路 径 上 的 每 一 个 节点 这 将 递归 } PRU SE XT» Finde SET. 821 








地 出 现 ， 因 此 实现 了 路 径 压 缩 。 - - = 
当 任意 执行 一 些 Union 操作 的 时 候 ， 路 径 ”图 8-15 用 路 径 压 缩 进行 不 相交 集 的 Fina 操 


压缩 是 一 个 好 的 想法 ， 因 为 存在 许多 的 深层 节 
点 可 通过 路 径 压 缩 将 它们 移 近 根 节点 。 业 已 证 明 ， 当 在 这 种 情况 下 进行 路 径 压 缩 时 ， 连 续 


M 次 操作 最 多 需要 OCM log N) 的 时 间 。 不 过 ,在 这 种 情形 下 确定 平均 情况 的 性 能 如 何 仍 然 
是 一 个 尚未 解决 的 问题 。 

路 径 压 缩 与 按 大 小 求 并 完全 兼容 ， 这 就 使 得 两 个 例 程 可 以 同时 实现 。 由 于 单独 进行 按 
大 小 求 并 要 以 线性 时 间 执 行 连续 M 次 运算 ， 因 此 还 不 清楚 在 路 径 压 缩 中 涉及 的 额外 一 趟 工 
作 平 均 来 讲 是 否 值得 。 这 个 问题 实际 上 仍然 没有 解决 。 不 过 后 面 我 们 将 会 看 到 ， 路 径 压 缩 
与 灵巧 求 并 法 则 的 结合 在 所 有 情况 下 都 将 产生 非常 有 效 的 算法 。 

路 径 压 缩 不 完全 与 按 高 度 求 并 兼容 ， 因 为 路 径 压 缩 可 以 改变 树 的 高 度 。 我 们 根本 不 清楚 
如 何 有 效 地 去 重新 计算 它们 。 答 案 是 不 去 计算 ! 此 时 ， 对 于 每 棵 树 所 存储 的 高 度 是 估计 的 高 度 
(有 时 称 为 秩 (rank))， 但 实际 上 按 秩 求 并 (演变 至 今 ) 理 论 上 和 按 大 小 求 并 效率 是 一 样 的 。 不 仅 如 
此 ， 高 度 的 更 新 也 不 如 大 小 的 更 新 频繁 。 与 按 大 小 求 并 一 样 ， 我 们 也 不 清楚 路 径 压 缩 平均 来 说 是 
和 否 值得 。 下 一 节 将 证 明 ， 使 用 求 并 试探 法 或 路 径 压 缩 都 能 够 显著 地 减少 最 坏 情 形 运行 时 间 。 


8.6 按 秩 求 并 和 路 径 压 缩 的 最 坏 情 形 


当 使 用 两 种 探测 法 时 ， 算 法 在 最 坏 情 形 下 几乎 是 线性 的 。 尤 其 是 在 最 坏 情 形 下 需要 的 
时 间 是 OCMa(M, ND) (假设 M NO. 其 中 , a(M，N) 是 Ackermann ph 7 AY wi, 
Ackermann PR RCM FE X 
AQ. j= 2 jf >1 
AG D=AG—1,2)37 S2 
AG.j)= AG—1,AG,j—1)).i,j >2 
由 此 我 们 定义 
a(M,N) = min(; > 1| AG.L M/N p > log N} 
你 可 能 想 要 计算 某 些 值 ， 不 过 实用 中 a(M，N) 三 4， 这 对 我 们 才 是 真正 重要 的 。 单 变 
量 逆 Ackermann KA A S log N, 它 是 N 的 直到 N 达 1 时 取 对 数 的 次 数 。 于 是 ， 





© Ackermann 函数 常常 用 A(1,，7) 一 /十 1，7 过 1 定义 。 书 中 的 形式 增长 得 更 快 ; 因此 ， 它 的 逆 增 长 得 就 更 慢 。 
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log" 65 536 王 4, 这 是 因为 log log log log 65 536—1, log' 25° =5, Ait BAIA. 2"5npi 
—^ 20 000 RFK. aM, MEREZI log’ NKE. Ai. aM, NA 
不 是 常数 ， 因 此 运行 时 间 并 不 是 线性 的 。 

本 节 的 其 余部 分 将 证 明 一 个 稍微 弱 一 些 的 结果 。 我 们 将 证 明 ， 任 意 顺 序 的 M—QCNDIX 
Union/Find 操作 花费 的 总 运行 时 间 为 OCM log”N)。 如 果 用 按 大 小 求 并 代替 按 秩 求 并 ， 
则 这 个 界 同 样 是 成 立 的 。 对 它 的 分 析 大 概 是 本 书 最 为 复杂 的 工作 ， 也 是 对 事实 上 实现 起 来 
非常 简单 的 一 个 算法 进行 的 第 一 次 真正 复杂 的 最 坏 情 形 分 析 。 


Union/Find 算法 分 析 


在 这 一 节 ， 我 们 对 连续 M=QCN) 次 Union/Find 操作 的 运行 时 间 建 立 一 个 相当 严格 
WA, Union Al Find 可 以 以 任何 顺序 出 现 ， 但 是 Union 是 按 秩 计 算 而 Find 则 利用 路 径 
压缩 完成 。 

我 们 通过 建立 某 些 涉及 秩 r 的 节点 个 数 的 引 理 开始 。 直 观 地 看 ， 由 于 按 秩 求 并 的 法 则 ， 
小 秩 的 节点 要 比 大 秩 的 节点 多 得 多 。 特 别 是 ， 最 多 可 能 存在 一 个 秩 为 log N 的 节点 。 我 们 
想 要 得 出 对 任意 给 定 秩 ~ 的 节点 个 数 的 一 个 尽 可 能 精确 的 界 。 由 于 秩 仅 当 Union 执行 (从 而 
仅 当 两 棵 树 具 有 相同 的 秩 ) 时 变化 ， 因 此 我 们 可 以 通过 忽略 路 径 压 缩 来 证 明 这 个 界 。 

引 理 8. 1 当 执行 一 系列 Union 指令 时 ， 一 个 秩 为 二 的 节点 必然 至 少 有 2 SEB AEE 
自己 )。 

证 明 : 数学 归纳 法 。 对 于 基准 情形 r—0 引 理 显然 成 立 。 令 工 是 秩 为 ”~ 的 具有 最 少 后 裔 
的 树 ， 并 令 X 是 了 的 根 。 设 涉及 X 的 最 后 一 次 Union EE T MT, 之 间 进 行 的 。 设 了 T 的 
HA X. WRT, WRT. WAT, 就 是 一 棵 高 度 为 ~ 的 树 且 比 工 有 更 少 的 后 裔 ， 这 与 T 
是 具有 最 少 后 裔 的 树 的 假设 矛盾 。 因 此 T 的 秩 小 于 等 于 r—1. T, WREST, 的 秩 。 
由 于 荆 有 秩 r MERREN T: 增加 ， 因 此 T; 的 秩 为 > 一 1。 于 是 T; 的 秩 为 > 一 1。 根 据 归 纳 
假设 ， 每 棵 树 至 少 有 2 个 后 裔 ， 从 而 总 数 为 2 E. S EEG. 

引 理 8. 1 告诉 我 们 ， 如 果 不 进 行路 径 压 缩 ， 那 么 秩 为 的 任意 市 点 必然 至 少 有 2 个 后 
裔 。 当 然 ， 路 径 压 缩 可 以 改变 这 种 状况 ， 因 为 它 能 够 把 后 裔 从 节点 上 除去 。 不 过 ， 当 进行 
Union, 甚 至 用 到 路 径 压 缩 时 ， 我 们 都 是 在 使 用 秩 ， 这 些 秩 是 高 度 的 估计 值 。 这 些 秩 的 行为 
就 像 是 没有 路 径 压 缩 一 样 。 因 此 ， 当 确定 秩 为 7 的 节点 个 数 的 界 时 ， 路 径 压 缩 可 以 忽略 。 

于 是 ， 下 面 的 引 理 对 于 有 路 径 压 缩 还 是 没有 路径 压缩 都 是 成 立 的 。 

引 理 8.2 秩 为 了 的 节点 的 个 数 最 多 是 N/2”。 

证 明 : 若 无 路 径 压 缩 ， 每 个 秩 为 7 的 节点 都 是 至 少 有 2 个 节点 的 子 树 的 根 。 在 该 子 树 
中 没有 其 秩 能 够 是 -的 节点 。 因 此 ， 秩 为 的 那些 节点 的 所 有 的 子 树 是 不 相交 的 。 于 是 ， 存 
在 至 多 N/2' 个 不 相交 的 子 树 ， 从 而 最 多 有 N/2' 个 秩 为 > 的 节点 。 

下 一 个 引 理 看 似 多 少 有 些 显而易见 ， 不 过 它 在 我 们 的 分 析 中 却 是 至 关 重 要 的 。 

引 理 8.3 Æ Union/Find 算法 的 任意 时 刻 ， 从 树叶 到 根 的 路 径 上 的 节点 的 秩 单调 增加 。 

证 明 : 如 果 不 存在 路 径 压缩 ， 那 么 该 引 理 显然 成 立 ( 参 见 例 子 )。 如 果 在 路 径 压 缩 后 某 
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个 节点 v 是 ww 的 一 个 后 裔 ， 那 么 当 只 考虑 Union 时 显然 v 必然 已 经 是 z 的 一 个 后 调 了 。 因 
JL. v 的 秩 少 于 ww 的 秩 。 

让 我 们 来 总 结 这 些 初 步 的 结果 。 引 理 8. 2 告诉 我 们 多 少 节点 可 以 赋予 秩 +。 因为 秩 只 有 
通过 Union 赋值 ， 所 以 引 理 8.2 在 Union/Find 算法 的 任何 阶段 甚至 在 路 径 压 缩 中 间 都 是 
成 立 的 。 图 8-16 指出 ， 当 存在 许多 秩 为 0 和 1 的 节点 时 ， 随 着 7 的 增 大 秩 为 7 的 节点 变 少 。 
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图 8-16 一 棵 大 的 不 相交 集 树 (节点 下 面 的 数 是 秩 ) 


引 理 8. 2 在 对 任意 秩 都 有 可 能 存在 N/2' 个 节点 的 定义 下 是 严格 的 。 但 该 引 理 还 是 稍 
微 有 些 宽松 ， 因 为 不 可 能 对 所 有 的 秩 7 这 个 界 同时 成 立 。 引 理 8. 2 描述 了 秩 为 7 的 节点 的 个 
数 ， 而 引 理 8. 3 则 告诉 我 们 它们 的 分 布 。 正 如 所 期 望 的 ， 节 点 的 秩 沿 着 从 树叶 到 根 的 路 径 
严格 递增 。 

现在 我 们 准备 证 明 主 要 的 定理 。 证 明 的 基本 想法 如 下 : 对 任何 节点 wv 的 Find 所 花费 的 
时 间 与 从 v 到 根 的 路 径 上 的 节点 的 个 数 成 正比 。 现 在 让 我 们 对 每 个 Find 在 从 vv 到 根 的 路 径 
上 的 每 一 个 节点 收取 一 个 单位 的 费用 。 为 了 帮助 我 们 计算 这 些 费 用 ， 我 们 想像 在 路 径 的 每 
一 个 节点 上 存 人 一 美 分 。 严 格 地 说 ， 这 是 一 个 会 计 诀 穿 ， 它 并 不 是 程序 的 一 部 分 。 当 算法 
结束 时 ， 我 们 将 已 经 存 人 的 所 有 分 币 敛 起来， 这 就 是 总 的 花费 。 

作为 进一步 的 会 计 诀 穿 ， 我 们 存 人 美 分 和 加 拿 大 分 两 种 分 币 。 我 们 将 证 明 ， 在 算法 执 
行 期 间 ， 对 于 每 次 Fina 我 们 只 能 存 人 一 定量 的 美 分 。 我 们 还 将 证 明 ， 只 能 存 人 一 定量 的 
加 拿 大 分 到 每 一 个 节点 上 。 把 这 两 笔 总 数 加 起 来 就 得 到 能 够 存 人 的 分 币 的 总 数 的 界 。 

现在 稍微 详细 地 概述 我 们 的 计算 方案 。 我 们 将 按照 秩 来 划分 节点 。 把 秩 分 成 一 些 秩 组 。 
对 每 个 Find， 我 们 将 把 一 些 美 分 币 存 成 共同 的 储 金 ， 而 把 加 拿 大 分 币 存 到 一 些 特定 的 项 点 
bk. 为 了 计算 所 存储 的 加 拿 大 分 币 的 总 数 ， 我们 将 计算 每 个 节点 上 的 储量 。 通 过 将 秩 7 的 
每 一 个 节点 的 储 金 加 起 来 ， 我 们 得 到 每 个 秩 ~ 的 总 的 储量 。 然 后 ， 我 们 再 把 秩 组 g 中 每 个 
Bk r 的 所 有 储量 加 起 来 从 而 得 到 每 个 秩 组 e 的 总 的 储量 。 最 后 ， 我 们 把 每 个 秩 组 g 的 所 有 
储 金 加 到 一 起 就 得 到 在 森林 中 存储 的 加 拿 大 分 币 的 总 数 。 把 这 笔 储 金 加 到 作为 共同 储 金 的 
美 分 币 的 数目 上 则 得 到 最 后 的 答案 。 

我 们 将 把 秩 划 分 成 组 。 秩 -被 分 到 组 G(r)， 而 G 将 在 后 面 确定 。 任 何 秩 组 g 中 最 大 的 
秩 为 FF(g)， 其 中 和 =G 是 G lij. TE, 在 任何 秩 组 g 0 中 秩 的 个 数 是 下 Cg) 一 
F(Cg 一 1)。 显 然 ，GCN) 是 最 大 秩 组 的 一 个 非常 宽松 的 上 界 。 作 为 一 个 例子 ， 假 设 我 们 按照 
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图 8-17 将 秩 分 组 。 在 这 种 情况 下 ，G(r) 二 [Yr 1。 在 组 g 中 的 最 大 的 秩 是 F(g) 王 g*， 并 观察 
到 组 g>0 包含 秩 F(g 一 1) 十 1 直到 FC(g)。 这 个 公式 不 适 。 一 一 ee 








用 秩 组 0， 因 此 为 了 方便 ， 我 们 将 保证 秩 组 0 只 包含 秩 为 。 “一 = 
0 的 元 素 。 注 意 ， 这 些 秩 组 是 由 一 些 连续 的 秩 构成 的 。 E "S 
我 们 以 前 提 到 过 ， 只 要 每 个 根 记录 着 它 的 子 树 都 是 |> P. 
4 10 — 16 
| i 


多 大 ， 则 每 个 Union 指令 仅 花 费 常 数 时 间 。 因 此 ， 就 本 
证 明 而 言 ，Union 实际 上 是 不 花费 代价 的 。 Ca ae 

fj^ Bindi) IER AU ALTE E FARK i 的 顶点 到 根 图 8-17 将 秩 分 成 秩 组 的 可 能 划分 
的 路 径 上 的 顶点 的 个 数 。 因 此 ， 我 们 对 于 路 径 上 的 每 一 个 顶点 存 人 一 个 分 币 。 不 过 ， 如 果 
这 就 是 我 们 所 做 的 全 部 ， 那 么 我 们 不 能 对 界 有 更 多 的 要 求 ， 因 为 没有 利用 到 路 径 压 缩 。 因 
此 ， 我 们 需要 在 分 析 中 利用 路 径 压 缩 。 我 们 将 使 用 想像 算账 (fancy accounting) 的 方法 。 

对 从 代表 i 的 顶点 到 根 的 路 径 上 的 每 一 个 顶点 ww， 我 们 在 两 个 账户 之 一 存 人 一 个 分 币 : 

l. WR ovER, 或 者 v 的 父亲 是 根 ， 或 者 v 的 父亲 在 与 v 不 同 的 秩 组 中 ,那么 在 该 法 

则 之 下 收取 一 个 单位 的 费用 ， 这 就 需要 将 一 个 美 分 币 存 人 公共 储 金 中 。 

2. 否则， 将 一 个 加 拿 大 分 币 存 人 该 顶点 中 。 

引 理 8.4 对 于 任意 的 Finqd(u)， 不 论 存 入 总 储 金 还 是 存 入 顶点 ， 所 存 分 币 的 总 数 恰好 
等 于 从 wv 到 根 的 路 径 上 的 节点 的 个 数 。 

证 明 : 显然 。 

如 此 一 来 ， 我 们 需要 做 的 就 是 把 在 法 则 1 下 存 人 的 所 有 的 美 分 币 和 在 法 则 2 下 存 和 人 的 
所 有 的 加 拿 大 分 币 加 起 来 。 

我 们 进行 最 多 M 次 Find。 我 们 需要 求 出 在 一 次 Find 中 能 够 存 人 公共 储 金 中 的 分 币 个 
数 的 界 。 

引 理 8.5 经 过 整个 算法 ， 在 法 则 1 下 美 分 币 总 的 存 入 量 总 计 为 M(G(N) 十 2)。 

证 明 : 证 明 不 难 。 对 于 任意 的 Find， 由 于 有 根 和 它 的 儿子 ， 因 此 存 入 两 个 美 分 币 。 由 
引 理 8.3， 沿 路 径 向 上 分 布 的 节点 按 秩 单调 递增 ， 而 由 于 最 多 有 GCN) 个 秩 组 ， 因 此 对 任意 
特定 的 Find， 在 路 径 上 只 有 GCN) 个 其 他 节点 能 够 按照 法 则 1 存 人 分 币 。 于 是 ,在 任意 一 
次 查找 期 间 最 多 有 GCN) 十 2 个 美 分 币 可 以 放 入 公共 储 金 中 。 因 此 ， 在 法 则 1 下， 连续 M 次 
Find 最 多 可 以 存 人 M(G(N) 十 2) 个 美 分 币 。 

为 了 得 到 在 法 则 2 下 所 有 加 拿 大 分 币 存 人 量 的 理想 的 估计 值 ， 我 们 将 把 按照 顶点 而 不 
是 按照 Find 指令 所 存 人 的 分 币 量 加 起 来 。 如 果 一 枚 硬币 在 法 则 2 下 存 人 顶点 v， WBA uv 
通过 路 径 压缩 移动 并 得 到 具有 比 它 原来 的 父 节点 更 高 的 秩 的 新 的 父亲 。( 在 这 里 ， 我 们 用 到 
了 正在 进行 路 径 压 缩 的 事实 。) 于 是 ， 秩 组 DO 中 的 节点 在 它 的 父 节点 被 推 离 秩 组 g 之 前 
最 多 可 以 移动 F(g) 一 F(g 一 1) 次 ， 因 为 这 是 该 秩 组 的 大 小 3。 在 这 以 后 ， 对 wv 的 所 有 未 来 
的 收费 均 按照 法 则 1 进行 。 

引 理 8.6 秩 组 g>0 中 顶点 的 个 数 V(g) 至 多 为 NM2Fe-D。 
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日 ”该 数 可 以 减 1。 不 过 ， 我 们 并 不 刻意 简化 ， 此 处 的 界 不 是 经 过 仔细 改进 的 界 。 
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WEAR: 由 引 理 8. 2， 至 多 存在 N/Z' 个 秩 为 ~ 的 顶点。 对 组 g 中 的 秩 求 和 ， 我 们 得 到 


s PN F E Km r "e QE US r 
EUN nd 
9|38 8.7. FARA g 8$ PE TR 3 69 MSAD REX IRAE $£XNFGO/2 9", 
证 明 : FARA RR ^ DLE EC es, Ie] T VALER ZH IST de & n] EL EC Fg) — FCg — D — 
F(g) 个 加 拿 大 分 币 ， 而 引 理 8. 6 告诉 我 们 这 样 的 顶点 存在 的 个 数 。 通 过 简单 的 乘法 可 以 得 
到 定理 的 结果 。 








引 理 8.8 在 法 则 2 下 总 的 存 入 分 币 数 最 多 为 NS FGD/27 个 加 拿 大 分 币 。 

证 明 : 因为 秩 组 0 只 含有 秩 为 0 的 元 素 ， 所 以 它 不 能 按照 法 则 2 接收 分 币 ( 这 样 的 元 素 
在 该 秩 组 中 不 可 能 有 父 节点 ) 。 在 通过 将 其 他 秩 组 求 和 则 可 得 到 引 理 指出 的 界 。 

这 样 ， 我 们 就 得 到 在 法 则 1 和 法 则 2 下 存 人 的 分 币 数 ， 该 总 数 为 


GON) 


OREN FN a Pip fate (8. 1) 


我 们 还 没有 指定 GON) REN FOND. SR. 实际 上 可 























秩 
以 自由 选择 我 们 想 要 的 任何 函数 ,但 是 它 应 使 得 选择 “一 
GCN) 极 小 化 上 面 的 界 有 意义 。 不 过 ,若是 GCN) 太 小 ， ! ! 
则 FCN) 就 会 很 大 ， 这 就 影响 到 我 们 的 界 。 一 个 明显 的 理 3 34 
想 选择 是 选取 FGi) 为 由 FO) =0 MFG) =2 BE X : RUE 
的 函数 。 于 是 得 到 GC(N) 二 1 二 Llog”N ]。 图 8-18 显示 秩 7 真正 大 的 秩 








是 如 何 由 此 而 划分 的 。 注 意 ， 组 0 只 包含 秩 0， 这 是 我 们 
在 前 面 引 理 中 要 求 的 。 下 非常 类 似 于 单 变 量 Ackermann 图 8-18 在 证 明 中 用 到 的 将 秩 分 成 
函数 ， 它 们 只 在 基准 情形 的 定义 上 有 所 不 同 C(F(0) = D. 和 

定理 8.1 M 次 Union 和 Find 的 运行 时 间 为 OM log?" ND, 

证 明 : dE F AG 的 定义 插入 式 (8.1) 中 ， 美 分 币 的 总 数 为 O(MG(N)) 二 OCM log? ND. Jil 
拿 大 分 币 的 总 数 为 ND FGp 2» = NS 19 NGOD = OWN log’ N)。 由 于 M=QCN), 因 
此 得 出 定理 的 界 。 

我 们 的 分 析 指 出 ， 能 够 通过 路 径 压 缩 经 常 移动 的 节点 很 少 ， 从 而 总 的 时 间 花 费 相 对 较 少 。 


8.7 一 个 应 用 


作为 怎样 可 以 使 用 该 数据 结构 的 一 个 例子 ， 考 虑 下 面 的 问题 。 我 们 有 一 个 计算 机 网 络 

一 个 双向 连接 表 ; 每 一 个 连接 可 将 文件 从 一 台 计 算 机 传送 到 另 一 台 计 算 机 。 那 么 ， 能 和 否 
TET ES ee SEER EEL RISUS PRA END 一 个 附加 的 限 
制 是 要 求 该 问题 必须 联机 (on-line) 解 决 。 因 此 ， 这 个 连接 表 要 一 次 一 个 地 给 出 ， 而 算法 则 
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必须 能 够 在 任意 时 刻 给 出 答案 。 

解决 这 个 问题 的 一 个 算法 可 以 在 开始 时 把 每 一 台 计 算 机 放 到 它 自 己 的 集合 中 。 我 们 要 
求 两 台 计 算 机 可 以 传输 文件 当 且 仅 当 它们 在 同一 个 集合 中 。 可 以 看 出 ， 传 输 文 件 的 能 力 形 
成 一 个 等 价 关系 。 此 时 我 们 一 次 一 个 地 读 入 连接 。 当 我 们 读 入 某 个 连接 (比如 (wu，wv)) 时 ， 
我 们 测试 是 否 u 和 w 在 同一 个 集合 中 ， 如 果 它 们 在 同一 个 集合 中 则 什么 也 不 做 。 如 果 它 们 
在 不 同 的 集合 中 ， 那 么 我 们 将 它们 所 在 的 两 个 集合 合并 。 在 算法 的 最 后 ， 当 且 仅 当 恰 好 存 
在 一 个 集合 ， 所 得 到 的 图 连通 。 如 果 存 在 M 个 连接 和 台 计 算 机 ， 那 么 空间 的 需求 则 是 
O(N)。 使 用 按 大 小 求 并 和 路 径 压 缩 的 方法 ， 我 们 得 到 最 坏 情形 运行 时 间 为 OCMa(M, ND. 
因为 存在 2M 次 Find 和 至 多 N 一 1 次 Union。 这 个 运行 时 间 在 实用 中 是 线性 的 。 

在 下 一 章 我 们 将 会 看 到 一 个 好 得 多 的 应 用 。 


我 们 已 经 看 到 保持 不 相交 集合 的 非常 简单 的 数据 结构 。 当 Union 操作 执行 时 ， 就 正确 
性 而 言 ， 哪 个 集合 保留 它 的 名 字 是 无 关 紧 要 的 。 这 里 ， 有 必要 注意 ， 当 某 一 步 尚 未 完全 指 
定 的 时 候 ， 考 虑 选择 方案 可 能 是 非常 重要 的 。Union 是 灵活 的 ; 借助 这 一 点 ,我们 能 够 得 
到 一 个 有 效 得 多 的 算法 。 
n 路 径 压 缩 是 自 调整 (self-adjustment) 的 最 早 形式 之 一 ， 我 们 已 经 在 别 的 一 些 地 方 (伸展 
l 





树 、 斜 堆 ) 见 到 过 。 它 的 使 用 非常 有 趣 ， 特 别 是 从 理论 的 观点 来 看 ， 因 为 它 是 算法 简单 但 最 
坏 情形 分 析 却 并 不 这 么 简单 的 第 一 批 例子 之 一 。 


Q 练习 


8.1 指出 下 列 一 系列 指令 的 结果 : Union(1, 2), Union(3, 4), Union(3, 5), Union 
(1, 7). Union(3, 6), Unviou(8, 9), Union(l, 8), tUnien(3, 10), minis, 
11), union(9, l2), nions, 18), Undon(l4, 15), union(l6, 17), Unidon 
(14, 16), Union(l, 3), Union(l, 14), 4 Union 是 
a. 任意 进行 的 。 
b. 按 高 度 进行 的 。 
c. 按 大 小 进行 的 。 

8.2 对 于 上 题 中 的 每 一 棵 树 ， 用 对 最 深 节 点 的 路 径 压 缩 执行 一 次 Find. 

8.3 ”编写 一 个 程序 来 确定 路 径 压 缩 法 和 各 种 求 并 方法 的 效果 。 你 的 程序 应 该 使 用 所 有 六 种 
可 能 的 方法 处 理 一 系列 等 价 操 作 。 

8.4 证明， 如 果 Union 按照 高 度 进行 ， 那 么 任意 一 棵 树 的 深度 为 O(log N)。 

8.5 a. 证 明 如 果 M=N’, 那么 M 次 Union/Find 操作 的 运行 时 间 是 OCM). 
b. EH, WR M=N log N, HBA M 次 union/Find 操作 的 运行 时 间 是 O(M)。 
xc. | M=O(N log log N), N| M Union/Find 操作 的 运行 时 间 是 多 少 ? 
xd. i M=O(N log”N)， 则 MY Union/Find 操作 的 运行 时 间 是 多 少 ? 
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8.6 指出 8&.7 节 中 的 程序 对 下 图 的 操作 : (1, 2), (3, 4), (3, 6), (5, 7), (4, 6), 
(2, 4), (8, 9), (5, 8), 连通 分 支 都 是 什 闪 3 
8.7 编写 一 个 程序 实现 8.7 节 的 算法 。 

x8.8 ”假设 我 们 想 要 添加 一 个 附加 的 操作 Deunion， 它 废除 尚未 被 废除 的 最 后 的 Union 操作 。 

a. ER: 如 果 我 们 按 高 度 求 并 以 及 不 用 路 径 压 缩 进 行 Find， 那 么 Deunion 操作 容 
易 进 行 并 且 连 续 M 次 Union, Find 和 Deunion 操作 花费 O(M log N) 时 间 。 
b. 为 什么 路 径 压 缩 使 得 Deunion 很 难 进行 ? 
xxc， 指 出 如 何 实现 所 有 三 种 操作 使 得 连续 M 次 操作 花费 O(CM log N /log log N) 时 间 。 280 

x8.9 假设 我 们 想 要 添加 一 种 额外 的 操作 Remove(X)， 该 操作 把 X 从 当前 的 集合 中 除去 并 
把 它 放 到 它 自己 的 集合 中 。 指 出 如 何 修改 Union/Find 算法 使 得 连续 M 次 Union、 
Find、 和 Remove 操作 的 运行 时 间 为 O(Ma(M, N)). 

xx8. 10 ”给 出 一 个 算法 以 一 棵 N 顶点 树 和 N 对 顶点 作为 输入 ， 对 每 对 顶点 (v，w) 确 定 v 和 
w 的 最 近 的 公共 祖先 。 你 的 算法 应 该 以 O(N log NWE T o 

x8.11 证明， 如 果 所 有 的 Union BE Fina 之 前 ， 那 么 使 用 路 径 压 缩 的 不 相交 集 算法 需要 
线性 时 间 ， 即 使 Union 是 任意 进行 的 也 是 如 此 。 

xx8.12 证明， 如 果 诸 Union 操作 任意 进行 ， 但 路 径 压 缩 是 对 Find 进行 ， 那么 最 坏 情形 运 
行 时 间 为 6(M log N), 

8.13 ”证 明 ， 如 果 Union 按 大 小 进行 且 执 行路 径 压缩 ， 那 么 最 坏 情形 运行 时 间 为 O(M log” N). 

8. 14” 设 我 们 通过 使 在 从 i 到 根 的 路 径 上 的 每 一 个 其 他 节点 指向 它 的 祖父 ( 当 有 意义 时 ) 以 实现 
对 Find(i) 的 偏 路 径 压 缩 (partial path compression), XUY E42 -F } (path halving)。 
a. 编写 一 个 程序 完成 上 述 工作 。 
b. 证 明 ， 如 果 对 诸 Find 操作 进行 路 径 平 分 ， 则 不 论 使 用 按 高 度 求 并 还 是 按 大 小 求 

并 ， 其 最 坏 情 形 运 行 时 间 皆 为 OCM log”N)。 
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(相对 于 整个 操作 序列 ) 确 定 运行 时 间 的 界 的 结果 可 在 文献 [4，13] 中 找到 。 


练习 8. 8 在 文献 [20] 中 解决 。 一 般 的 Union/Find 结构 在 文献 [19] 中 给 出 ， 这 种 





支持 更 多 的 操作 。 
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在 这 一 章 ， 我 们 讨论 图 论 中 几 个 一 般 的 问题 。 这 些 算法 不 仅 在 实践 中 有 用 ， 而 且 因 为 
在 许多 实际 生活 的 应 用 中 若 不 仔细 注意 数据 结构 的 选择 将 导致 速度 过 慢 ， 所 以 这 些 算 法 还 
是 非常 有 趣 的 。 我 们 将 : 

e 介绍 几 个 现实 生活 中 发 生 的 问题 ， 它 们 可 以 转化 成 图 论 问题 。 

e 给 出 一 些 算法 以 解决 几 个 普通 的 图 论 问 题 。 

e 指出 适当 选择 数据 结构 可 以 极 大 地 降低 这 些 算法 的 运行 时 间 。 

e 介绍 一 个 被 称 为 深度 优先 搜索 (depth-first search) 的 重要 技巧 ， 并 指出 它 如 何 能 够 以 

线性 时 间 求 解 若 干 表面 上 非 平凡 的 问题 。 


9.1 若干 定义 


—^* A (graph)G=(V, E) FAIA (vertex) I] 4E V 和 边 (edge) 的 集 下 组成。 每 一 条 边 就 
是 一 幅 点 对 (v，w)， 其 中 v，wEV。 有 时 也 把 边 称 作 约 (arc)。 如 果 点 对 是 有 序 的 ， 那 么 图 就 
是 有 向 (directed) 的 。 有 向 的 图 有 时 也 叫 作 有 向 图 (digraph)。 顶 点 wv 和 w 邻接 (adjacent) 当 且 仅 
"Co. WEE. 在 一 个 具有 边 (v，w) 从 而 具有 边 (w，v) 的 无 向 图 中 ，w Alo BRA v 也 和 
w 邻接 。 有 时 候 边 还 具有 第 三 种 成 分 ， 称 作 权 (weight) 或 值 (cost)。 


图 中 的 一 条 路 径 (path) 是 一 个 顶点 序列 wi, wes w, =, wy fi Cw, wii) EE, 
1 过 i 二 N。 这 样 一 条 路 径 的 长 (length) 是 该 路 径 上 的 边 数 ， 它 等 于 N 一 1。 从 一 个 顶点 到 它 
自身 可 以 看 作 一 条 路 径 ; 如 果 路 径 不 包含 顶点 ， 那 么 路 径 的 长 为 0。 这 是 定义 特殊 情形 的 一 
种 方便 的 方法 。 如 果 图 含有 一 条 从 一 个 顶点 到 它 自 身 的 边 (v，v)， 那 么 路 径 w，u 有 时 候 也 
叫 作 一 个 环 (loop)。 我 们 要 讨论 的 图 一 般 将 是 无 环 的 。 一 条 简单 路 径 是 这 样 一 条 路 径 其 
上 的 所 有 顶点 都 是 互 异 的 ， 但 第 一 个 项 点 和 最 后 一 个 顶点 可 能 相同 。 


有 向 图 中 的 圈 (cycle) 是 满足 wi 二 wy 且 长 至 少 为 1 的 一 条 路 径 ; 如 果 该 路 径 是 简单 路 
径 ， 那 么 这 个 圈 就 是 简单 圈 。 对 于 无 向 图 ,我 们 要 求 边 是 互 异 的 。 这 些 要 求 的 根据 在 于 无 
向 图 中 的 路 径 u, v, 不 应 该 视 为 圈 ， 因 为 (u,v) 和 (v，w) 是 同一 条 边 。 但 是 在 有 向 图 中 
它们 是 两 条 不 同 的 边 ， 因 此 称 它们 为 圈 是 有 意义 的 。 如 果 一 个 有 问 图 没有 圈 ， 则 称 其 为 无 
图 的 (acyclic) 。 一 个 有 向 无 圈 图 有 时 也 简称 为 DAG. 

如 果 在 一 个 无 向 图 中 从 每 一 个 顶点 到 每 个 其 他 顶点 都 存在 一 条 路 径 ， 则 称 该 无 向 图 是 
连通 的 (connected)。 具 有 这 样 性 质 的 有 向 图 称 为 强 连 通 的 (strongly connected)。 如 果 一 个 
有 向 图 不 是 强 连通 的 , 但 是 它 的 基础 图 (underlying graph)， 即 其 弧 上 去 掉 方 向 所 形成 的 
图 ， 是 连通 的 ， 那 么 该 有 问 图 称 为 弱 连 通 的 (weakly connected)。 完 全 图 (complete graph) 
是 其 每 一 对 顶点 间 都 存在 一 条 边 的 图 。 

现实 生活 中 能 够 用 图 进行 模拟 的 一 个 例子 是 航空 系统 。 每 个 机 场 是 一 个 顶点 ， 在 由 两 
个 项 点 表示 的 机 场 间 如 果 存 在 一 条 直达 航线 ， 那 么 这 两 个 顶点 就 用 一 条 边 连接 。 边 可 以 有 
一 个 权 ， 表示 时 间 、 距 离 或 飞行 的 费用 。 有 理由 假设 ,这 样 的 一 个 图 是 有 向 图 ， 因 为 在 不 
同 的 方向 上 飞行 可 能 所 用 时 间或 所 花 的 费用 会 不 同 (例如 ,依赖 于 地 方 税 )。 可 能 我 们 更 愿 
意 航 空 系统 是 强 连 接 的 ， 这 样 就 总 能 够 从 任意 一 个 机 场 飞 到 男 外 的 任意 一 个 机 场 。 我 们 也 
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可 能 想 要 迅速 确定 任意 两 个 机 场 之 间 的 最 佳 航线 。“ 最 佳 ” 可 以 是 指 最 少 边 数 的 路 径 ， 也 可 
以 是 对 一 种 或 所 有 的 权重 度量 所 算出 的 最 佳 者 。 

交通 流 可 以 用 一 个 图 来 模型 化 。 每 一 条 街道 交叉 口 表 示 一 个 项 点， 而 每 一 条 街道 就 是 
一 条 边 。 边 的 值 可 能 代表 速度 限度 ， 或 是 容量 (车 道 的 数目 )， 等 等 。 此 时 我 们 可 能 需要 找 
出 一 条 最 短路 ， 或 用 该 信息 找 出 交通 瓶颈 最 可 能 的 位 置 。 

在 本 章 的 其 余部 分 ， 我 们 将 考察 有 关 图 论 的 更 多 应 用 ， 这 些 图 中 许多 可 能 是 相当 巨大 
的 ， 因 此 ， 我 们 使 用 的 算法 的 效率 是 非常 重要 的 。 


图 的 表示 
我 们 将 考虑 有 向 图 (无 向 图 可 类 似 表示 )。 
暂时 假设 我 们 可 以 从 1 开始 对 顶点 编号 。 图 9-1 表示 含有 7 个 顶点 和 12 条 边 的 图 。 


表示 图 的 一 种 简单 的 方法 是 使 用 一 个 
二 维 数组 ， 称 为 邻接 矩阵 (adjacent matrix) 
表示 法 。 对 于 每 条 边 (u, v), 我们 置 ALu] 
[v]=1; 否则 ， 数 组 的 元 素 就 是 0。 如 果 边 
有 一 个 权 ， 那 么 我 们 可 以 置 ALujLwvj 等 于 
该 权 ， 而 使 用 一 个 很 大 或 者 很 小 的 权 作为 
标记 表示 不 存在 的 边 。 例 如 ， 如 果 寻 找 最 
便宜 的 航空 路 线 ， 那 么 我 们 可 以 用 值 =e (或 
者 也 许 使 用 0) 来 表示 不 存在 的 边 。 NS coPHNIS 

虽然 这 么 表示 的 优点 是 非常 简单 ， 但 是 ， 它 的 空间 需求 则 为 96(1V1*)， 如 果 图 的 边 不 是 
很 多 ,那么 这 种 表示 的 代价 就 太 大 了 。 若 图 是 稠密 (dense) 的 : | E] =OC|V |?) WA He He E 
是 合适 的 表示 方法 。 不 过 ， 在 我 们 将 要 看 到 的 大 部 分 应 用 中 ， 情 况 并 非 如 此 。 例 如 ， 设 用 图 
表示 一 个 街道 地 图 ， 街 道 呈 曼哈顿 式 方向 ， 其 中 几乎 所 有 的 街道 或 者 南北 向 ， 或 者 东西 向 。 
因此 ， 任 意 路 口 大 致 都 有 四 条 街道 ， 于是， 如 果 图 是 有 向 图 且 所 有 的 街道 都 是 双向 的 ， 则 
|E|~4|V|. MRA 3 000 个 路 口 ， 那 么 我 们 就 得 到 一 个 3 000 顶点 的 图 ， 该 图 有 12 000 条 边 ， 
它们 需要 一 个 大 小 为 9 000 000 的 数组 。 该 数组 的 大 部 分 元 素 将 是 0。 这 直观 看 来 很 糟 ， 因 为 
我 们 想 要 我 们 的 数据 结构 表示 那些 实际 存在 的 数据 ， 而 不 是 去 表示 不 存在 的 数据 。 

如 果 图 不 是 稠密 的 ， 换 句 话 说 ， 如 果 图 是 稀疏 的 (sparse)， 则 更 好 的 解决 方法 是 使 用 邻 
接 表 (adjacency list) 表 示 。 对 每 一 个 顶点 ， 我 们 使 用 一 个 表 存 放 所 有 邻接 的 顶点 。 此 时 的 空 
间 需 求 为 OC|E| -1V |o. Bl 9-2 最 左边 的 结构 只 是 头 单元 (header cell) 的 数组 。 这 种 表示 
方法 如 图 9-2 所 示 。 如 果 边 有 权 ， 那么 这 个 附加 的 信息 也 可 以 存储 在 单元 中 。 

邻接 表 是 表示 图 的 标准 方法 。 无 向 图 可 以 类 似 地 表示 ; 每 条 边 (u，v) 出 现在 两 个 表 中 ， 
因此 空间 的 使 用 基本 上 是 双 倍 的 。 在 图 论 算法 中 通常 需要 找 出 与 某 个 给 定 顶 点 v 邻接 的 所 有 
的 顶点 。 而 这 可 以 通过 简单 地 扫描 相应 的 邻接 表 来 完成 ， 所 用 时 间 与 这 些 顶 点 的 个 数 成 正比 。 

在 大 部 分 实际 应 用 中 顶点 都 有 名 字 而 不 是 数字 ， 这些 名 字 在 编译 时 是 未 知 的 。 由 于 我 
们 不 能 通过 未 知名 字 为 一 个 数组 做 索引 ， 因 此 我 们 必须 提供 从 名 字 到 数字 的 映射 。 完 成 这 
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项 工作 最 容易 的 方法 是 使 用 散 列 表 ， 在 该 散 列 表 中 我 们 对 每 个 顶点 存储 一 个 名 字 以 及 一 个 
范围 在 1 到 |V| 之 间 的 内 部 编号 。 这 些 编号 在 读 人 图 的 时 候 指 定 。 指 定 的 第 一 个 数 是 1。 在 



























































输入 每 条 边 时 ,我 们 检查 是 否 它 的 两 个 顶点 都 已 经 指定 了 一 个 数 ， 检 查 的 方法 是 看 是 否 硕 
点 在 散 列 表 中 。 如 果 在 ， 那么 我 们 就 使 用 这 个 内 部 编号 ， 否则 ， 我 们 将 下 一 个 可 用 的 编号 
分 配给 该 项 点 并 把 该 项 点 的 名 字 和 对 应 的 编号 插入 到 散 列 表 中 。 
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图 9-2 图 的 邻接 表 表 示 法 


经 过 这 样 的 变换 ， 所 有 的 图 论 算法 都 将 只 使 用 内 部 编号 。 由 于 最 终 我 们 还 是 要 输出 项 
点 的 名 字 而 不 是 这 些 内 部 编号 ， 因 此 对 于 每 一 个 内 部 编号 我 们 必须 记录 相应 的 顶点 名 字 。 
一 种 记录 方法 是 使 用 字符 串 数组 。 如 果 顶 点 名 字 长 ， 那 就 要 花费 大 量 的 空间 ， 因 为 项 点 的 
名 字 要 存 两 次 。 男 一 种 方法 是 保留 一 个 指向 散 列 表 内 的 指针 数组 ， 这 种 方法 的 代价 是 稍微 
损失 散 列 表 ADT 的 纯洁 性 ( 散 列 表 的 元 素 就 不 是 通过 基本 的 散 列表 操作 来 访问 了 )。 

在 本 章 中 使 用 的 代码 将 是 尽 可 能 使 用 ADT 的 伪 代 码 。 这 人 么 做 将 节省 空间 ， 当 然 ， 也 使 
得 算法 的 运算 表达 式 更 清晰 。 


9.2 拓扑 排序 


拓扑 排序 是 对 有 向 无 圈 图 的 顶点 的 


一 种 排序 ， 它 使 得 如 果 存 在 一 条 从 可 到 2 | 

vj 的 路 径 ， 那 么 在 排序 中 v HEUTE vi I scs -waopao] (wpaimj — of consen 

后 面 。 图 9-3 表示 迈阿密 州立 大 学 的 课 — ee r 

程 结构 。 有 向 边 (u，w) 表 明 课程 v 必须 (cese 4 com Y conse} es 

在 课程 w 选修 前 修 完 。 这 些 课程 的 拓扑 CN l 

排序 是 不 破坏 课程 结构 要 求 的 任意 课程 {2888} — one) — n 

序列 。 i "s i 
显然 ， 如 果 图 含有 圈 ， 那 么 拓扑 排序 pee pe deg 


是 不 可 能 的 ， 因为 对 于 圈 上 的 两 个 顶点 vw 图 9-3 ”表示 课程 结构 的 无 圈 图 


Fw. vc ww XT v. NE). FRA EMEA) FEM A AEE ABE AT A. fE 





B] 9-4rh, v, tee tes ths ths tes wM 1s ws Uys is ws ws 入 两 个 都 是 拓扑 排序 。 v 
一 个 简单 的 求 拓扑 排序 的 算法 是 先 找 出 任意 一 一 286 
一 个 没有 进入 边 的 顶点 。 然 后 我 们 显 印 出 该 项 点， A FK 
并 将 它 和 它 的 边 一 起 从 图 中 删除 。 然 后 ， 我 们 对 b 
图 的 其 余部 分 同样 应 用 这 样 的 方法 处 理 。 COO a (os ) 
为 了 将 上 述 方法 形式 化 ,我 们 把 顶点 o fA N aub E 2 
IE Cindegree) XW (us v) 的 条 数 。 我 们 计算 图 em Bs 
中 所 有 顶点 的 入 度 。 假 设 初 始 化 Indegree 数组 2 K 
且 将 图 读 和 人 一 个 邻接 表 中 ,那么 此 时 我 们 可 以 应 图 9-4 一 个 无 力图 


用 图 9-5 中 的 算法 生成 一 个 拓扑 排序 。 





void | 
Topsort( Graph G ) 
{ 


int Counter; 
Vertex V, W; 


for( Counter = 0; Counter < NumVertex; Counter++ ) 


V = FindNewVertexOfIndegreeZero( ); 
if ( V == NotAVertex ) 


Error( "Graph has a cycle" ); 
break; | 
| 


} 

TopNum[ V ] = Counter; 

for each W adjacent to V 
Indegree[ W ]--; 








图 9-5 简单 的 拓扑 排序 伪 代 码 


函数 FindNewVertexOfIndegreezero 扫描 Indegree 数组 ， 寻 找 一 个 尚未 分 配 拓 扑 编号 
的 入 度 为 0 的 顶点 。 如 果 这 样 的 顶点 不 存在 ， 那 么 它 返 回 Notavertex; 这 就 指出 ， 该 图 有 圈 。 

因为 FindNewVertexOfIndegreezero 是 对 Indegree 数组 的 一 个 简单 的 顺序 扫描 ， 所 以 
每 次 对 它 的 调用 都 花费 OC| V | ) 时 间 。 由 于 有 |V| 次 这 样 的 调用 ， 因 此 该 算法 的 运行 时 间 为 
OUVI I 

通过 更 仔细 地 注意 该 数据 结构 我 们 可 以 做 得 更 好 。 产 生 坏 的 运行 时 间 的 原因 在 于 对 
Indegree 数组 的 顺序 扫描 。 如 果 图 是 稀 玻 的 ,那么 我 们 就 可 以 预知 ， 在 每 次 迭代 期 间 只 
有 一 些 顶 点 的 入 度 被 更 新 。 然 而 ， 虽 然 只 有 一 小 部 分 发 生变 化 ， 但 在 搜索 入 度 为 0 的 顶点 
时 我 们 (潜在 地 ) 查 看 了 所 有 的 顶点 。 

我 们 可 以 通过 将 所 有 (未 分 配 拓 扑 编号 ) 的 人 度 为 0 的 顶点 放 在 一 个 特殊 的 盒子 中 而 消除 这 种 
无 效 的 劳动 。 此 时 FindNewvertexOfIndegreeZero 图 数 返回 (并 删除 ) 盒 子 中 的 任意 顶点 。 当 
我 们 降低 这 些 邻 接 顶 点 的 人 度 时 ， 检 查 每 一 个 顶点 并 在 它 的 人 度 降 为 0 时 把 它 放 入 盒子 中 。 

为 实现 这 个 盒子 ， 我 们 可 以 使 用 一 个 栈 或 队列 。 首 先 ， 对 每 一 个 顶点 计算 它 的 入 度 。 
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然后 ， 将 所 有 人 和 人 度 为 0 的 顶点 放 入 一 个 初始 为 空 的 队列 中 。 当 队列 不 空 时 ， 删 除 一 个 顶点 
v， 并 将 与 v 邻接 的 所 有 的 顶点 的 入 度 减 - 一 一 sie - 
1。 只 要 一 个 顶点 的 人 度 降 为 0， 就 把 该 | WR 1 2 B 4 5 6 7 
顶点 放 和 人 队列 中 。 此 时 ， 拓 扑 排序 就 是 项 | on "ow a 4 v cog 
点 出 队 的 顺序 。 图 9-6 显示 每 一 阶段 之 后 v3 2. 3 1 1 0 0 0 
的 状态 。 |? c» $ x3 4 X. 3 
这 个 算法 的 伪 代 码 实现 在 图 9-7 中 给 | “ EIE ME 
出 。 和 前 面 一 样 ， 假 设 已 经 将 图 读 到 一 个 | AK n vo vw ww we u 
邻接 表 中 且 计 算 入 度 并 放 入 一 个 数组 内 。 | n n non n n n 











在 实践 中 做 这 件 工 作 的 方便 方法 通常 是 把 
每 一 个 项 点 的 人 度 放 人 头 单元 中 。 我 们 还 
假设 有 一 个 数组 TopNum， 该 数组 存放 的 是 拓扑 编号 。 


9-6 ”对 图 9-4 应 用 拓扑 排序 的 结果 





| void 
| Topsort( Graph G ); 
{ 

Queue Q; 

int Counter = 0; 

Vertex V, W; 
/* 1*/ Q = CreateQueue( NumVertex ); MakeEmpty( Q ); 
/[t 2*f for each vertex V , 
g[95 3*7 if( Indegree[ V ] == 0 ) 
/* 4*/ Enqueue( V, Q ); 
JE S87 while( !IsEmpty( Q ) ) 

{ 
/* 6*/ V = Dequeue( Q ); 
fe TEL TopNum[ V ] = ++Counter; /*Assign next number */ 
A Beh for each W adjacent to V 
/* 9*/ ifC --Indegree[ W ] == 0 ) 
/*10*7 Enqueue( W, Q ); 

} 
Pi if ( Counter != NumVertex ) 
/*12*/ Error( "Graph has a cycle" ); 
FELII. DisposeQueue( Q ); /* Free the memory */ 

} 











9-7 ”施行 拓扑 排序 的 伪 代 码 


如 果 使 用 邻接 表 ， 那 么 执行 这 个 算法 所 用 的 时 间 为 O(IE| 十 |V|)。 当 认识 到 for 循 
环 体 对 每 条 边 最 多 执行 一 次 时 ， 这 个 结果 是 明显 的 。 队 列 操作 对 每 个 顶点 最 多 进行 一 次 ， 
而 初始 化 各 步 花费 的 时 间 也 和 图 的 大 小 成 正比 。 


9.3 最 短路 径 算法 
本 节 考 察 各 种 最 短路 径 问 题 。 输 入 是 一 个 赋 权 图 : 与 每 条 边 (v;，w;) 相 联系 的 是 穿越 该 
弧 的 代价 (或 称 为 值 )cv 。 一 条 路 径 viov AYE ee » OY PE MRA ER 1 K (weighted path 
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length), 。 而 无 权 路 径 长 Cunweighted path length) 只 是 路 径 上 的 边 数 ， 即 N 一 1。 

单 源 最 短路 径 问 题 

给 定 一 个 赋 权 图 G 二 (V，E) 和 一 个 特定 顶点 ;作为 输入 ， 找 出 从 s 到 G 中 每 一 个 其 他 
顶点 的 最 短 赋 权 路 径 。 

例如 ， 在 图 9-8 P. M vi 到 w 的 最 短 赋 权 路 径 的 值 为 6， 它 是 从 vw 到 vw, 到 vw; 再 到 ww 的 
路 径 。 在 这 两 个 顶点 间 的 最 短 无 权 路 径 长 为 2。 一 般 说 来 ， 当 不 指明 我 们 讨论 的 是 赋 权 路 径 
还 是 无 权 路 径 时 ， 如 果 图 是 赋 权 的 ， 那 么 路 径 就 是 赋 权 的 。 还 要 注意 ,在 图 9-8 中 ， 从 mw 
F v KAMI. 

前 面 例 子 中 的 图 没有 负 值 的 边 。 图 9-9 指出 负 边 的 问题 可 能 产生 。 从 vw; 到 v. AKI 
值 为 1， 但 是 ， 通 过 下 面 的 循环 v;，v, ，v,。，wv; ，vi 存 在 一 条 最 短路 径 ， 它 的 值 是 一 5。 这 
条 路 径 仍 然 不 是 最 短 的 ， 因 为 我 们 可 以 在 循环 中 滞留 任意 长 。 因 此 ,在 这 两 个 顶点 间 的 最 
短路 径 问题 是 不 确定 的 。 类 似 地 ， 从 vi 到 vw; 的 最 短路 径 也 是 不 确定 的 ， 因 为 我 们 可 以 进入 
同样 的 循环 。 这 个 循环 叫 作 负 值 圈 (negative-cost cycle); 当 它 出 现在 图 中 时 ， 最短 路径 问 
题 就 是 不 确定 的 。 有 负 值 的 边 未必 就 是 坏事 ,但 是 它们 的 出 现 似 乎 使 问题 增加 了 难度 。 为 
方便 起 见 ， 在 没有 负 值 圈 时 ， 从 s 到 的 最 短路 径 为 0。 
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图 9-8 有 向 图 G 图 9-9 带 有 负 值 圈 的 图 


有 许多 的 例子 使 我 们 可 能 要 去 求解 最 短路 径 问 题 。 如 果 顶 点 代表 计算 机 ; 边 代 表 计 算 
机 间 的 链接 ; 值 表示 通信 的 花费 (每 1000 字 节 数据 的 电话 费 )、 延 迟 成 本 (传输 1000 字 节 所 
需要 的 秒 数 )， 或 它们 及 其 他 一 些 因素 的 组 合 ， 那 么 我 们 可 能 利用 最 短路 问题 来 找 出 从 一 台 
计算 机 向 一 组 其 他 计算 机 发 送 电 子 新 闻 的 最 便宜 的 方法 。 

我 们 可 能 使 用 图 为 航线 或 其 他 大 规模 运输 路 线 建立 模型 并 利用 最 短路 径 算法 计算 两 点 
间 的 最 佳 路 线 。 在 这 样 的 以 及 许多 实际 的 应 用 中 ， 我 们 可 能 想 要 找 出 从 一 个 顶点 s 到 另 一 
个 顶点 上 的 最 短路 径 。 当 前 ， 还 不 存在 找 出 从 到 一 个 顶点 的 路 径 比 找 出 从 s 到 所 有 顶点 路 
径 更 快 ( 快 一 个 常数 因子 ) 的 算法 。 

我 们 将 考察 求解 该 问题 四 种 形态 的 算法 。 首 先 ， 我 们 要 考虑 无 权 最 短路 径 问 题 并 指出 如 
何以 OCIE| 十 |V|) 时 间 解 决 它 。 其 次 ,我们 还 要 介绍 ， 如 果 假 设 没有 人 负 边 ， 那 么 如 何 求解 赋 
权 最 短路 径 问题 。 这 个 算法 在 使 用 合理 的 数据 结构 实现 时 的 运行 时 间 为 O E | log | V DD. 

如 果 图 有 负 边 ， 我 们 将 提供 一 个 简单 的 解法 ， 不 过 它 的 时 间 界 不 理想 , OJEJ VD. 
最 后 ,我 们 将 以 线性 时 间 解 决 无 圈 图 特殊 情形 的 赋 权 的 问题 。 
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9.3.1 无 权 最 短路 径 
图 9-10 表示 一 个 无 权 的 图 G。 使 用 某 个 项 点 ; 作为 输入 参数 ,我们 想 要 找 出 从 s 到 所 有 其 








他 顶点 的 最 短路 径 。 我 们 只 对 包含 在 路 径 A e 

中 的 边 数 有 兴趣 ， 因 此 在 边 上 不 存在 权 。 pA 

显然 ,这 是 赋 权 最 短路 径 问题 的 特殊 情形 ， M C S 

因为 我 们 可 以 为 所 有 的 边 都 赋 以 权 1。 po bad ex 
暂时 假设 我 们 只 对 最 短路 径 的 长 而 不 CA Nek »P- 


是 具体 的 路 径 本 身 有 兴趣 。 记 录 实 际 的 路 ria Pi 
径 只 不 过 是 简单 的 簿 记 问 题 。 ve) f 51 


设 我 们 选择 s 为 w 。 此 时 我 们 立刻 可 
以 说 出 从 * 到 w 的 最 短路 径 是 长 为 0 的 路 全 
径 。 把 这 个 信息 作 个 标记 ， 得 到 图 9-11, 

现在 我 们 可 以 开始 寻找 所 有 从 s 出 发 距离 为 1 的 顶点 。 这 些 顶 点 通过 考察 与 * 邻接 的 那 
些 顶点 可 以 找到 。 此 时 我 们 看 到 ，w Alo JA s 出 发 只 一 边 之 各 ， 如 图 9-12 所 示 。 
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l 图 9-11 将 开始 节点 标记 为 通过 0 条 边 可 以 图 9-12 找 出 所 有 从 s 出 发 路 径 长 为 1 的 
292 到 达 的 节点 后 的 图 顶点 之 后 的 图 


现在 可 以 开始 找 出 那些 从 * 出 发 最 短路 径 恰 为 2 的 顶点 ， 我 们 找 出 所 有 邻接 到 vi 和 vs 
的 顶点 (距离 为 1 处 的 顶点 )， 它 们 的 最 短路 径 还 不 知道 。 这 次 搜索 告诉 我 们 ， 到 vs 和 wv, 的 
最 短路 径 长 为 2。 图 9-13 显示 到 现在 为 止 已 经 做 出 的 工作 。 

最 后 ， 通 过 考察 那些 邻接 到 刚 被 赋值 的 v2 和 wv 的 顶点 ， 我们 可 以 发 现 v; 和 vi 各 有 一 条 
三 边 的 最 短路 径 。 现 在 所 有 的 顶点 都 已 经 被 计算 ， 图 9-14 显示 算法 的 最 后 结果 。 
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图 9-13 找 出 所 有 从 s 出 发 路 径 长 为 图 9-14 最 后 的 最 短路 径 


2 的 顶点 之 后 的 图 


这 种 搜索 一 个 图 的 方法 称 为 广度 优先 搜索 (breadth-first search)。 该 方法 按 层 处 理 顶 
点 : 距 开 始点 最 近 的 那些 顶点 首先 被 赋值 ， 而 最 远 的 那些 顶点 最 后 被 赋值 。 这 很 像 对 树 的 


I Feil Jj Clevel-order traversal), 


有 了 这 各 方法， 我们 必须 把 它 翻译 成 代码 。 图 9-15 显示 该 | — zx 
算法 将 要 用 到 的 记录 其 过 程 的 表 的 初始 配置 。 a a ae 
对 于 每 个 顶点 ,我 们 将 跟踪 三 个 信息 。 首 先 , 我 们 把 从 s e | o = 0| 
开始 到 顶点 的 距离 放 到 4, 栏 中 。 开 始 的 时 候 ， 除 * 外 所 有 的 顶 |o oov 
点 都 是 不 可 达 的 ,而 * 的 路 径 长 为 0。p, 栏 中 的 项 为 短 记 变量 ， | 上- 一 | 


它 将 使 我 们 能 够 显 印 出 实际 的 路 径 。Known 中 的 项 在 顶点 被 处 

















9-15 用 于 无 权 最 短路 计 


理 以 后 置 为 1。 起初， 所 有 的 顶点 都 不 是 known( 已 知 的 )， 包 See ee 
括 开始 顶点 。 当 一 个 顶点 被 标记 为 已 知 时 ， 我 们 就 有 了 不 会 再 找到 更 便宜 的 路 径 的 保证 ， 


因此 对 该 顶点 的 处 理 实 质 上 已 经 完成 。 

基本 的 算法 在 图 9-16 中 描述 。 图 9-16 中 的 算法 模拟 这 些 图 表 ， 它 把 距离 4 二 0 上 的 项 
点 声明 为 Known， 然 后 声明 d=1 上 的 顶点 为 Known， 再 声明 d=2 上 的 顶点 为 Known， 等 
等 ， 并 且 将 仍然 是 d.= 王 ce 的 所 有 邻接 的 顶点 w 置 为 距离 d= 二 d 十 1。 
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/* 4*/ 
/* 5*/ 
/* 6*/ 
7* 7*/ 
/* 8*/ 





void 
Unweighted( Table T ) /* Assume T is initialized */ 


int CurrDist; 
Vertex V, W; 


for( CurrDist = 0; CurrDist « NumVertex; CurrDist++ ) 
for each vertex V 
if C !T[ V ].Known && T[ V ].Dist == CurrDist ) 
1 
TL V ].Known = True; 
for each W adjacent to V 
ifC T[ w ].Dist == Infinity ) 
{ 
TL W ].Dist = CurrDist + 1; 
T[ W ].Path = V; 
} 








9-16 无 权 最 短路 算法 的 伪 代 码 


通过 追溯 p, 变 量 ， 可 以 显 印 实际 的 路 径 。 当 讨论 赋 权 的 情形 时 我 们 将 会 看 到 如 何 进行 。 
HT MK for 循环 ， 因 此 该 算法 的 运行 时 间 为 O(IV|1*)。 这 个 明显 的 低 效率 
在 于 ， 尽 管 所 有 的 顶点 早 就 成 为 known 了 ,但 是 外 层 循环 还 是 要 继续 ， 直 到 Num Vertex-1 
为 止 。 虽然 额 外 的 附加 测试 可 以 避免 这 种 情形 发 生 ,， 但 是 它 并 不 能 影响 最 坏 情形 运行 时 





间 ， 在 将 从 顶点 vs 开始 的 图 9-17 作为 输入 时 ,通过 将 所 发 生 的 情况 一 般 化 即 可 看 到 这 
— Fic 
OOOO O-OOOG) 


图 9-17 使 用 图 9-16( 伪 代码 ) 的 无 权 最 短路 算法 的 坏 情形 
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我 们 可 以 用 非常 类 似 于 对 拓扑 排序 所 做 的 那样 来 排除 这 种 低 效 性 。 在 任意 时 刻 ， 只 存 
在 两 种 类 型 的 未 知 顶 点 ， 它 们 的 d, Aco, — EMA AY d, 二 CurrDist， 而 其 余 的 则 有 d, = 
CurrDist 十 1。 由 于 这 种 附加 的 结构 ， 在 第 2 行 和 第 3 行 搜 索 整 个 表 以 找 出 合适 的 顶点 的 
做 法 是 非常 浪费 的 。 

一 种 非常 简单 但 抽象 的 解决 方案 是 保留 两 个 盒子 。#1 盒 将 装 有 d, =CurrDist 的 未 
知 顶点 ， 而 #2 AWRA d.=CurrDist +1] 的 那些 顶点 。 在 第 2 行 和 第 3 行 的 测试 可 以 用 
查找 #1 盒 内 的 任意 顶点 代替 。 在 第 8 行 以 后 (if 语句 的 内 部 )， 我 们 可 以 把 w 加 到 #2 a 
中 。 在 外 层 for 循环 终止 以 后 ，#1 盒 是 空 的 ， 而 #2 盒 则 可 转换 成 #1 盒 以 进行 下 一 趟 
for 循环 。 

我 们 甚至 可 以 使 用 一 个 队列 把 这 种 想法 进一步 精 化 。 在 迭代 开始 的 时 候 ， 队 列 只 含有 
距离 CurrDist 的 那些 顶点 。 当 我 们 添加 距离 CurrDist 十 1 的 那些 邻接 顶点 时 ， 由 于 它们 
自 队 尾 人 队 ， 因 此 这 就 保证 它们 直到 所 有 上 距离 为 CurrDist 的 顶点 都 处 理 之 后 才 处 理 。 在 
距离 CurrDist 处 的 最 后 一 个 项 点 出 队 并 处 理 之 后 ， 队 列 只 含有 距离 为 CurrDist 十 1 的 顶 
点 ， 因 此 该 过 程 将 不 断 进行 下 去 。 我 们 只 需要 把 开始 的 节点 放 入 队列 中 以 启动 这 个 过 程 
即 可 。 

精练 的 算法 在 图 9-18 中 示 出 。 在 伪 代 码 中 ,我 们 已 经 假设 开始 项 点 s 是 知道 的 且 
T[s].Dist 为 0。C 例 程 可 能 把 ;作为 参数 传递 。 再 有 ， 如 果 某 些 顶 点 从 开始 节点 出 发 是 

可 达 的 ， 那么 有 可 能 队列 会 过 早 地 变 空 。 在 这 种 情况 下 ， 将 对 这 些 节 点 报 出 Infinity 
(无 穷 ) 距 离 ， 这 就 完全 合理 了 。 最 后 ，Known 域 没有 使 用 ; 一 个 顶点 一 旦 被 处 理 它 就 从 不 
青 进 入 队列 ， 因 此 它 不 需要 重新 处 理 的 事实 就 意味 着 被 做 了 标记 。 这 样 一 来 ，Known 域 可 
以 去 掉 。 图 9-19 指出 我 们 一 直 在 使 用 的 图 上 的 值 在 算法 期 间 是 如 何 变化 的 。 我们 保留 
Known 域 为 的 是 使 得 表 更 容易 沿用 并 使 得 与 本 节 其 余部 分 保持 一 致 。 


void 
Unweighted( Table T ) /* Assume T is initialized (Fig 9.30) */ 
{ 








Queue Q; 
Vertex V, W; 
/[* 1*7 Q = CreateQueue( NumVertex ); MakeEmpty( Q ); 
/* Enqueue S" start vertex S, determined elsewhere */ 
/* 2*/ Enqueue( S, Q ); 
J* 3*7 while( !IsEmpty( Q ) ) 
{ 
/[* 4*/ V = Dequeue( Q ); 
/* $*/ TL V ].Known = True; /* Not really needed anymore */ 
| /* 6*/ for each W adjacent to V 
/* PY ifC T[ W ].Dist == Infinity ) 
{ 
/* 8*/ TCW ].Dist = TC V ].Dist + 1; 
JE 9x/ TL W ].Path = V; 
/*10*/ Enqueue( W, Q ); 
} 
} 
/*11*/ DisposeQueue( Q ); /* Free the memory */ 








9-18. 无 权 最 短路 算法 的 伪 代 码 
























































初始 状态 vs 出 队 v; 出 队 ve 出 队 | 
v Known d, p,| Known d, p,| Known d, P. | Known d, f, 
Vi 0 c 0 0 1 uw 1 l d» 1 1 v3 
v 0 c 0 0 æ 0 0 2 n 0 2 Ww 
vs 0 0 0 1 0 0 1 ó Lh 3 0 0 
v4 0 < 0 0 2 0| 0 2 | 0 2- d | 
Us 0 2 0 0 & 0| 0 e 0 0 ~ 0 
Us 0 % 0l 0 1 vs 0 1 v3 1 1 £5 
v; 0 e 人 | © = Ul 9 x 0 0 o 0 
Q Us | Vis U6 Ug, V2, U4 U3, V4 
v2 出 队 vs 出 队 vs 出 队 | v; HBA Il 
v Known d, p, | Known d, p, | Known d, p, Known d, Pe | 
Ui 1 1 vi 1 1 v | 1 1 n 1 l 9 | 
v) 1 2 n 1 2 w 1 2 ù 1 2 w| 
v3 1 0 0 1 D 0 1 0- p 1 0 0 
Us 0 2 vw | 1 2 wu 1 2 n 1 2 n 
Us 0 3 uA 0 3. a 1 3 0a 1 3 wa | 
Ug 1 1 Ui 1 1 v3 1 1 Ui 1 1 v3 | 
v; 0 e 0| 0 3 414 0 3 w| 1 3 t% | 
| Q : U4, U5 | Us, U7 vs c | 




















9-19 无 权 最 短路 算法 期 间 数 据 如 何 变化 


使 用 与 对 拓扑 排序 进行 的 同样 的 分 析 ， 我 们 看 到 ， 只 要 使 用 邻接 表 ， 则 运行 时 间 就 是 
OCLE| - |V DD. 


9.3.2 Dijkstra 算法 

如 果 图 是 赋 权 图 ， 那 么 问题 (明显 ) 就 变 得 困难 了 ， 不 过 我 们 仍然 可 以 使 用 来 自 无 权 情 
形 时 的 想法 。 

我 们 保留 所 有 与 前 面相 同 的 信息 。 因 此 ， 每 个 顶点 或 者 标记 为 known( 已 知 ) 的 ,或 者 


标记 为 unknown( 未 知 ) 的 。 像 以 前 一 样 ， 对 每 一 个 顶点 保留 一 个 临时 距离 4,。 这 个 距离 实 
际 上 是 使 用 已 知 顶 点 作为 中 间 顶 点 从 s 到 ww 的 最 短路 径 的 长 。 和 以 前 一 样 ， 我 们 记录 p 


它 是 引起 d, 变 化 的 最 后 的 顶点 。 

解决 单 源 最 短路 径 问 题 的 一 般 方法 叫 作 Dijkstra 算法 。 这 个 有 30 年 历史 的 解法 是 贪 
焚 算 法 (greedy algorithm) 最 好 的 例子 。 贪 禁 算 法 一 般 分 阶段 求解 一 个 问题 ， 在 每 个 阶段 
它 都 把 出 现 的 当 作 是 最 好 的 去 处 理 。 例 如 ， 为 了 用 美国 货币 找 零 钱 ， 大 部 分 人 首先 点 数 
出 若干 25 分 一 个 的 硬币 阔 特 (quarter) ， 然 后 是 若干 一 角 币 、 五 分 币 和 一 分 币 。 这 种 贪 楚 
算法 使 用 最 少数 目的 硬币 找 零钱 。 贪 焚 算 法 主要 的 问题 在 于 该 算法 不 总 成 功 。 为 了 找 还 
15 美 分 的 零钱 ， 如 添加 12 美 分 一 个 的 货币 则 可 破坏 这 种 找 零 钱 算法 ， 因 为 此 时 它 给 出 
的 答案 (一 个 12 分 币 和 三 个 一 分 币 ) 不 是 最 优 的 (一 个 角 币 和 一 个 五 分 币 ) 。 

Dijkstra 算法 按 阶段 进行 ， 正 像 无 权 最 短路 径 算 法 。 在 每 个 阶段 ，Dijkstra 算法 选择 一 
个 项 点 v， 它 在 所 有 未 知 顶 点 中 具有 最 小 的 4,， 同 时 算法 声明 从 s 到 wv 的 最 短路 径 是 已 知 
的 。 阶 段 的 其 余部 分 由 d 值 的 更 新 工作 组 成 。 

在 无 权 的 情形 下 ， 若 d. =M] E 4 二 4d, 十 1。 因 此 ， 若 顶点 v 能 提供 一 条 最 短路 径 ， 
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则 我 们 本 质 上 降低 了 d. 的 值 。 如 果 我 们 对 赋 权 的 情形 应 用 同样 的 逻辑 ,那么 当 4 的 新 值 
d, 十 cw 是 一 个 改进 的 值 时 我 们 就 置 d= 二 4d, 十 c,,。 简 言 之 ,使 用 通 向 w 路 径 上 的 顶点 v 是 
不 是 一 个 好 主意 由 算法 决定 。 原 始 的 值 d 是 不 用 wv 的 值 ， 上 面 所 算出 的 值 是 使 用 v( 和 仅仅 
那些 已 知 的 顶点) 最 便宜 的 路 径 。 

图 9-20 是 一 个 例子 。 图 9-21 表示 初始 配置 ， 假 设 开始 节点 是 w 。 第 一 个 选择 的 顶点 
是 v1 ， 路 径 的 长 为 0。 该 项 点 标记 为 已 知 。 既 然 已 知 ， 那 么 某 些 表 项 就 需要 调整 。 邻 接 
到 vi 的 顶点 是 vw 和 wv。 这 两 个 顶点 的 项 得 到 调整 ， 如 图 9-22 所 示 。 






























































OE NECS 
4/ ^ 1 af —\10 | v | Known d, f, v | Known d, p. | 
P NAT d X w eS » RJ dI 1-5 
I dis 2 " ( va ) 2 vs) n 0 o 0| v 0 2 d4 
i pr v3 | 0 5. 0 | v3 0 o 0 
3 8/ NS 67 || va | 0 € 0 | v4 0 l w 
W P d AN f | Us 0 oc 0 Us 0 oo 0 | 
Meg Up ies | o =o “| o =o] 
( ey mm ms \ ed v7 0 eo 0 v7 0 x 0 
图 9-20 有 向 图 G 图 9-21 用 于 Dijkstra 算法 图 9-22 在 vi 被 声 阴 为 
的 表 的 初始 配置 已 知 后 的 表 
下 一 步 ， 选 取 v 并 标记 为 已 知 。 顶 点 vs，v;，vs，wv 是 邻接 的 顶点 ， 而 它们 实际 上 都 


需要 调整 ， 如 图 9-23 所 示 。 

接 下 来 选择 w 。w 是 邻接 的 点 ,但 已 经 是 已 知 的 ， 因 此 对 它 没有 工作 要 做 。w; 是 邻接 
的 点 但 不 做 调整 ， 因 为 经 过 这 的 值 为 2 十 10=12 而 长 为 3 的 路 径 已 经 是 已 知 的 。 图 9-24 指 
出 在 这 些 顶 点 被 选取 以 后 的 表 。 

下 一 个 被 选取 的 顶点 是 v;， 其 值 为 3。V; 是 唯一 的 邻接 顶点 , 但 是 它 不 用 调整 ， 因 为 
3 十 6 这 5。 然后 选取 v, XF vs 的 距离 下 调 到 3 十 5 二 8。 结 果 如 图 9-25 所 示 。 



























































v ] Known d, py | | v | Known d, p, | [| s Known d, Pe 
EE EDE | Pee ES 
vy 1 0 0 vi 1 0 0 | | n 1 0 0 | 
| ¥2 0 2 n v) 1 2 wu n 1 2 w || 
V3 0 3 va v3 0 3 i v3 1 3 vs 
Va 1 lou V4 1 i 34 U4 1 1 wy |l 
vs 0 3 n4 Us 0 3 wu l| vs 1 3 w || 
vs 0 9 wv Us 0 9 vs | vs 0 8 vy | 
v 0 5 va | v; 0 5 on | v7 0 5 n| 


























9-23 Æ vs 被 声明 为 已 知 后 9-24 在 v; 被 声明 为 已 知 后 ” 图 9-25 在 vs 然后 v3 被 声明 为 已 知 后 

下 一 个 选取 的 顶点 是 v, v FIA 5 十 1 二 6。 我 们 得 到 图 9-26 所 示 的 表 。 

最 后 ， 我 们 选择 w 。 最 后 的 表 如 图 9-27 所 示 。 图 9-28 以 图 形 演示 在 Dijkstra 算法 期 间 
各 边 是 如 何 标记 为 已 知 的 以 及 顶点 是 如 何 更 新 的 。 

为 了 显 印 出 从 开始 顶点 到 某 个 顶点 v 的 实际 路 径 ， 我 们 可 以 编写 一 个 递归 例 程 跟踪 p 
数组 留 下 的 踪迹 。 

现在 我 们 给 出 实现 Dijkstra 算法 的 伪 代 码 。 我 们 将 假设 ， 为 方便 起 见 这 些 顶 点 从 0 标 
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号 到 NumVertex-1( 见 图 9-29) 并 假设 通过 例 程 ReadGraph 可 以 将 图 读 入 一 个 邻接 表 中 。 
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图 9-26 在 v; 被 声明 为 已 知 后 
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图 9-27 在 vs 被 声明 为 已 知 以 及 算法 终止 之 后 








图 9-28 Dijkstra 算法 的 各 个 阶段 


在 图 9-30 的 例 程 中 ， 开 始 的 顶点 被 传递 到 初始 化 例 程 中 。 这 是 代码 中 需要 知道 顶点 的 


唯一 位 置 。 


利用 图 9-31 中 的 递归 例 程 可 以 显 印 出 这 个 路 径 。 该 例 程 递归 地 显 印 路 径 上 直到 项 点 v 
前 面 的 顶点 的 整个 路 径 ， 然 后 再 显 印 顶 点 vw。 这 是 没有 问题 的 ， 因 为 路 径 是 简单 的 。 

图 9-32 列 出 主要 的 算法 ， 它 就 是 一 个 使 用 贪 禁 选取 法 则 填 表 的 for 循环 。 

利用 反 证 法 的 证 明 将 指出 ， 


只 要 没有 边 有 负 的 值 ， 该 算法 总 能 够 顺利 完成 。 如 果 任 何 
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一 边 出 现 负 值 ， 则 算法 可 能 得 出 错误 的 答案 ( 见 练习 9. 7a) 。 运 行 时 间 依 赖 于 对 表 的 处 理 方 
法 ,我们 必须 考虑 。 如 果 使 用 扫描 表 来 找 出 最 小 值 4, 这 种 明显 算法 ， 那么 每 一 步 将 花费 
OC(IV|) 时 间 找 到 最 小 值 ， 从 而 整个 算法 过 程 中 查找 最 小 值 将 花费 OCIV1*) 时 间 。 每 次 更 新 
d 的 时 间 是 常数 ， 而 每 条 边 最 多 有 一 次 更 新 ， 总 计 为 O(|E|)。 因 此 ， 总 的 运行 时 间 为 
“) 二 OC(IV1*)。 如 果 图 是 稠密 的 ， 边 数 |E|= 二 8@(1V1*)， 则 该 算法 不 仅 简单 而 


OC|E|+|V 





且 基 本 上 最 优 ， 因 为 它 的 运行 时 间 与 边 数 成 线性 关系 。 





f 





typedef int Vertex; 
struct TableEntry 


List Header; /* Adjacency list */ 
int Known; 
DistType Dist; 
Vertex Path; 
h 


/* Vertices are numbered from 0 */ 
#define NotAVertex (-1) 
typedef struct TableEntry Table[ NumVertex ]; 








图 9-29 Dijkstra 算法 的 声明 





void 
InitTable( Vertex Start, Graph G, Table T ) 


int i; 
1*/ ReadGraph( G, T ); /* Read graph somehow */ 
2*/ for( i = 0; i « NumVertex; i++ ) 
{ 
3*/ T[ i ].Known = False; 
4*/ TL i ].Dist = Infinity; 
5*7 TL i ].Path = NotAVertex; 
} 
6*/ TL Start ].dist = 0; 





9-30” 表 初始 化 例 程 





{ 





/* Print shortest path to V after Dijkstra has run */ 
/* Assume that the path exists */ 


void 
PrintPath( Vertex V, Table T ) 


if( T[ V ].Path != NotAVertex ) 
{ 


PrintPath( TE V ].Path, T ); 
printfCc " to" 5); 


} 
printf( "Xv", V); /* Xv is pseudocode */ 





图 9-31 显 印 实际 最 短路 径 的 例 程 











id 
Dijkstra( Table T ) 
{ 
Vertex V, W; 
/* 1*7 forC ; 3) 
{ 
7* 25} V = smallest unknown distance vertex; 
I" 3*J if( V == NotAVertex ) 
f* 4*/ break; 
y* s*y TE V ].Known = True; 
Le 647 for each W adjacent to V 
/* 7*/ ifC !T[ W ].Known ) 
/* 8*/ ifC T[ V ].Dist + Cw « T[ W ].Dist ) 
(  /* Update W */ 
/* 9*/ Decrease( T[ W ].Dist to 
T[ V ].Dist + Cvw ); 
/*10*/ TL W ].Path = V; 
} 
} 
} 











图 9-32 dijkstra 算法 的 伪 代 码 


WRAEK, WAEL SOV). 那么 这 种 算法 就 太 慢 了 。 在 这 种 情况 下 ， 距 离 
需要 存储 在 优先 队列 中 。 有 两 种 方法 可 以 做 到 这 一 点 ,二 者 是 类 似 的 。 

第 2 行 与 第 5 行 联合 形成 一 个 DeleteMin 操作 ， 因 为 一 旦 未 知 的 最 小 值 顶 点 被 找到 ， 
那么 它 就 不 再 是 未 知 的 ， 必 须 从 未 来 的 考虑 中 除去 。 在 第 9 行 的 更 新 可 以 有 两 种 方法 实现 。 

一 种 方法 是 把 更 新 处 理 成 DecreaseKey 操作 。 此 时 ， 查 找 最 小 值 的 时 间 为 O(log|V|)， 
就 像 执行 那些 更 新 的 时 间 ， 它 相当 于 那些 DecreaseKey 操作 。 由 此 得 出 运行 时 间 为 
OC| E|log|V| - |V|log| V |) —OC| Ellog| V D. " Jeu Big re Re c Pa A e gp. B T L^ 
队列 不 是 有 效 地 支持 Pina 操作 ， 因 此 4d; 的 每 个 值 在 优先 队列 的 位 置 将 需要 保留 并 当 d E 
优先 队列 中 改变 时 更 新 。 如 果 优 先 队 列 是 用 二 叉 堆 实 现 的 ， 那 么 这 将 很 难 办 。 如 果 使 用 配 
对 堆 (pairing heap， 见 第 12 章 )， 则 程序 不 会 太 差 。 

另 一 种 方法 是 在 每 次 执行 第 9 行 时 把 w 和 新 值 4 插入 优先 队列 。 这 样 ， 在 优先 队列 中 
的 每 个 顶点 就 可 能 有 多 于 一 个 的 代表 。 当 DeleteMin 操作 把 最 小 的 顶点 从 优先 队列 中 删除 
时 ， 必 须 检查 以 肯定 它 不 是 已 经 知道 的 。 这 样 ， 第 2 行 变 成 一 个 循环 ， 它 执行 DeleteMin 
直到 一 个 未 知 的 顶点 合并 为 止 。 这 种 方法 虽然 从 软件 的 观点 看 是 优越 的 ， 而 且 编程 确实 容 
BELZ, 但是， 队列 的 大 小 可 能 达到 |E| 这 么 大 。 由 于 |E| 三 1V|* 意 味 着 log|E|<2 log|V| 
因此 这 并 不 影响 渐 近 时 间 界 。 这 样 ， 我们 仍然 得 到 一 个 O(|E|log|V|) 算 法 。 不 过 ， 空 间 
需求 的 确 增加 了 ， 在 某 些 应 用 中 这 可 能 是 严重 的 。 不 仅 如 此 ， 因 为 该 方法 需要 |E| 次 而 不 
是 仅仅 |V | 次 DeleteMin， 所 以 它 在 实践 中 很 可 能 较 慢 。 

注意 ， 对 于 一 些 诸如 计算 机 邮件 和 大 型 公交 传输 的 典型 问题 ， 它 们 的 图 一 般 是 非常 稀 
朴 的 ， 因 为 大 多 数 顶点 只 有 两 条 边 。 因 此 ,在 许多 应 用 中 使 用 优先 队列 来 解决 这 种 问题 是 
很 重要 的 。 

如 果 使 用 不 同 的 数据 结构 ， 那 么 Dijkstra 算法 可 能 会 有 更 好 的 时 间 界 。 在 第 11 章 ， 我 
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们 将 看 到 另外 的 优先 队列 数据 结构 ， 叫 作 斐 波 那 契 堆 (Fibonacci heap)。 使 用 这 种 数据 结构 
的 运行 时 间 是 O(C| 已 | 十 |VlloglV|)。 斐 波 那 契 堆 具有 良好 的 理论 时 间 界 ， 不 过 ， 它 需 
相当 数量 的 系统 开销 。 因 此 ， 尚 不 清楚 在 实践 中 是 否 使 用 斐 波 那 契 堆 比 使 用 具有 二 又 堆 的 
Dijkstra 算法 更 好 。 不 用 说 ， 这 种 问题 没有 平均 情形 的 时 间 结 果 ， 因 为 连 如 何 建立 随机 图 的 
模型 甚至 都 不 是 明显 的 。 


9. 3.3 具有 负 边 值 的 图 


如 果 图 具有 负 的 边 值 ,那么 Dijkstra 算法 是 行 不 通 的 。 问 题 在 于 ， 一 旦 一 个 顶点 uu 
声明 是 已 知 的 ， 那 就 可 能 从 某 个 另外 的 未 知 顶 点 v 有 一 条 回 到 的 负 的 路 径 。 在 这 样 的 情 
形 下 ， 选 取 从 ;到 w 再 回 到 的 路 径 要 比 从 s 到 但 不 过 wv 更 好 。 练 习 9. 7a 要 求 构造 一 个 
明晰 的 例子 。 

一 个 诱 人 的 方案 是 将 一 个 常数 4 加 到 每 一 条 边 的 值 上 ， 如 此 除去 负 的 边 ， 再 计算 新 图 
的 最 短路 径 问 题 ， 然 后 把 结果 用 到 原来 的 图 上 。 这 种 方案 的 直接 实现 是 行 不 通 的 ， 因 为 那 
些 具 有 许多 条 边 的 路 径 变 成 比 那些 具有 很 少 边 的 路 径 权重 更 重 了 。 

把 赋 权 的 和 无 权 的 算法 结合 起 来 将 会 解决 这 个 问题 ， 但 是 要 付出 运行 时 间 激 烈 增 长 的 
代价 。 我 们 忘记 了 关于 未 知 的 顶点 的 概念 ， 因 为 我 们 的 算法 需要 能 够 改变 它 的 意向 。 开 始 ， 
我 们 把 s 放 到 队列 中 。 然 后 ， 在 每 一 阶段 让 一 个 顶点 出 队 。 找 出 所 有 与 v 邻接 的 顶点 w, 
使 得 da > di + cowo RARER dA pw. 并 在 ww 不 在 队列 中 的 时 候 把 它 放 到 队列 中 。 可 以 为 
每 个 顶点 设置 一 个 位 (bit) 以 指示 它 在 队列 中 出 现 的 情况 。 我 们 重复 这 个 过 程 直到 队列 空 为 
ik. 图 9-33( 儿 乎 7) 实现 这 个 算 法 。 





void /* Assume T is initialized as in Fig 9.18 */ 
WeightedNegative( Table T ) 
{ 
Queue Q; 
Vertex V, W; 
/* 1*7 Q = CreateQueue( NumVertex ); MakeEmpty( Q ); 
Le 257 Enqueue( S, Q ); /* Enqueue the start vertex S */ 
fe py while( !IsEmpty( Q ) ) 
1 
/* 4*/ V = Dequeue( Q ); 
/* 5*/ for each W adjacent to V 
A 6*/ ifC TL V ].Dist + Cw < T[ W ].Dist ) 
{ 
/* Update W */ 
/* 7*/ TL W ].Dist = T[ V ].Dist + Cw; 
f® 8*/ T[ W ].Path = V; 
/* 9*/ ifC W is not already in Q ) 
/*10*/ Enqueue( W, Q ); 
} 
} 
/*11*/ DisposeQueue( Q ); 
} 











图 9-33 具有 负 边 值 的 赋 权 最 短路 径 算法 的 伪 代码 
虽然 如 果 没 有 负 值 圈 该 算法 能 够 正常 工作 ,但 是 ， 第 6 一 10 行 的 代码 每 边 只 执行 一 次 
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的 情况 不 再 成 立 。 每 个 顶点 最 多 可 以 出 队 |V [| 次， 因此， 如 果 使 用 邻接 表 则 运行 时 间 是 
OCLE] * |VY|)( 见 练习 9.7b)。 这 比 Dijkstra 算法 多 很 多 ， 幸 运 的 是 ， 实 践 中 边 的 值 是 非 负 
的 。 如 果 负 值 圈 存 在 ， 那 么 算法 正如 所 写 的 将 无 限 地 循环 下 去 。 通 过 在 任意 项 点 已 经 出 队 
IV| 十 1 次 后 停止 算法 运行 ， 我们 可 以 保证 它 能 终止 。 


9.3.4 无 圈 图 


如 果 知 道 图 是 无 圈 的 ,那么 我 们 可 以 通过 改变 声明 顶点 为 已 知 的 顺序 (或 者 叫 作 顶 
取 法 则 ) 来 改进 Dijkstra 算法 。 新 法 则 是 以 拓扑 顺序 选择 顶点 。 由 于 选 en 
排序 执行 的 时 候 进 行 ， 因 此 算法 能 够 一 趟 完成 。 

因为 当 一 个 顶点 二 被 选取 以 后 ， 按 照 拓扑 排序 的 法 则 它 没有 从 未 知 顶 点 发 出 的 进入 边 ， 
因此 它 的 距离 d, 可 以 不 再 被 降低 ， 所 以 这 种 选择 法 则 是 行 得 通 的 。 

使 用 这 种 选择 法 则 不 需要 优先 队列 ; 由 于 选择 花费 常数 时 间 ， 因 此 运行 时 间 为 
CX EI - VI», 





a 到 点 565， 但 只 能 走 下 坡 ， 显 然 不 
可 能 有 圈 。 男 一 bn a Gi y 模 型 。 我 们 可 以 让 每 个 顶点 代表 实验 的 
一 个 特定 的 状态 ， 让 边 代 表 从 一 种 状态 到 另 一 种 状态 的 转变 ， 而 边 的 权 代 表 释 放 的 能 量 。 
如 果 只 能 从 高 能 状态 转变 到 低能 状态 ， 那么 图 就 是 无 圈 的 。 

无 轿 图 的 一 个 更 重要 的 用 途 是 关键 路 径 分 析 法 (critical path analysis) 。 我 们 将 用 图 9-34 
作为 例子 。 每 个 节点 表示 一 个 必须 执行 的 动作 以 及 完成 动作 所 花费 的 时 间 。 因 此 ， 该 图 叫 
作 动 作 节点 图 (activity-node graph) 。 图 中 的 边 代 表 优 先 关 系 : 一 条 边 (v，w) 意 味 着 动作 v 
必须 在 动作 ww 开始 前 完成 。 当 然 ， 这 就 意味 着 图 必须 是 无 圈 的 。 我 们 假设 任何 (直接 或 间 
接 ) 互 相 不 依赖 的 动作 可 以 由 不 同 的 服务 器 并 行 地 执行 。 


get E e 
(A(3) | F(3 
49, 9. 
E dd 
开始 boy, 结束 
s P 


BOS —ka) 


图 9-34 动作 节点 图 


这 种 类 型 的 图 可 以 (并 常常 ) 用 来 模拟 方案 的 构建 。 在 这 种 情况 下 ， 有 了 几 个 问题 需要 
回答 。 首 先 ， 方 案 最 早 完成 时 间 是 何 时 ? 从 图 中 我 们 可 以 看 到 ， 沿 路 径 A，C,， 下 ， 互 需 
要 10 个 时 间 单 位 。 另 一 个 重要 的 问题 是 确定 哪些 动作 可 以 延迟 ， 延 迟 多 长 ， 而 不 至 影响 
isi. Hl. $EXS A. C. F, H rn f fe 3€ — Tr A 35 f se X EE T8] HE 8] 10 个 时 间 
单位 以 后 。 另 一 方面 ， 动作 已 从 重要 ， 可 以 被 延迟 两 个 时 间 单 位 而 不 至 于 影响 最 后 完成 
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时 间 。 

为 了 进行 这 些 运算 ， 我 们 把 动作 节点 图 转化 成 事件 节点 图 (eventrnode graph)。 每 个 事 
件 对 应 一 个 动作 和 所 有 与 它 无 关 的 动作 的 完成 。 从 事件 节点 图 中 的 节点 wv 可 达到 的 事件 可 
以 在 事件 v 完成 后 开始 。 这 个 图 可 以 自动 构造 ， 也 可 以 人 工 构造 。 哑 边 和 哑 节 点 可 能 需要 
被 插入 到 一 个 动作 依赖 于 几 个 其 他 动作 的 地 方 。 为 了 避免 引进 假 相 关 性 (或 相关 性 的 假 的 短 
缺 )， 这 么 做 是 必要 的 。 对 应 图 9-34 的 事件 节点 图 如 图 9-35 所 示 。 








图 9-35 事件 节点 图 


为 了 找 出 方案 的 最 早 完成 时 间 ， 我 们 只 要 找 出 从 第 一 个 事件 到 最 后 一 个 事件 的 最 长 路 
径 的 长 。 对 于 一 般 的 图 ， 最 长 路 径 问 题 通常 没有 意义 ， 因 为 可 能 有 正 值 的 圈 (positive-cost 
cycle) 存 在 。 这 些 正 值 圈 等 价 于 最 短路 问题 中 的 负 值 圈 。 如 果 出 现 正 值 圈 ， 那 么 我 们 可 以 寻 
找 最 长 的 简单 路 径 ， 不 过 ， 对 于 这 个 问题 没有 已 知 的 满意 解决 方案 。 由 于 事件 节点 图 是 无 
圈 图 ， 因 此 我 们 不 必 担 心 圈 的 问题 。 在 这 种 情况 下 ， 容 易 采 纳 最 短路 径 算法 计算 图 中 所 有 
节点 最 早 完成 时 间 。 如 果 EC; 是 节点 i 的 最 早 完成 时 间 ， 那 么 可 用 的 法 则 为 


EC,= 0 
EC, = max ( ECs T 65,2) 
图 9-36 显示 在 我 们 的 实例 事件 节点 图 中 每 个 事件 的 最 早 完成 时 间 。 
0 7 F/3 0 f T 
; D Tm Hi (10) 
8 G/2 
KI4 m 








图 9-36 最早 完成 时 间 


我 们 还 可 以 计算 每 个 事件 能 够 完成 而 不 影响 最 后 完成 时 间 的 最 晚 时 间 LC;。 进 行 这 项 
工作 的 公式 为 
LC,= EC, 


LG,— min CLG = 
(vw EE 


对 于 每 个 顶点 ， 通 过 保存 一 个 所 有 邻接 且 在 先 的 顶点 的 表 ， 这 些 值 就 可 以 以 线性 时 间 算 出 。 
借助 顶点 的 拓扑 顺序 计算 它们 的 最 早 完成 时 间 ， 而 最 晚 完成 时 间 则 通过 倒转 它们 的 拓扑 顺 
序 来 计算 。 最 晚 完 成 时 间 如 图 9-37 所 示 。 

事件 节点 图 中 每 条 边 的 松弛 时 间 (slack time) 代 表 对 应 动作 可 以 延迟 而 不 推迟 整体 的 完 
成 的 时 间 量 。 容 易 看 出 
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图 9-37 最 晚 完 成 时 间 


图 9-38 指出 在 事件 节点 图 中 每 个 动作 的 松弛 时 间 ( 作 为 第 三 项 )。 对 于 每 个 节点 ， 顶 上 的 数 
是 最 早 完成 时 间 ， 底 下 的 数 是 最 晚 完成 时 间 。 


2- C/3/0 
ann 8 1 
ax (6 
w^ ~8/2/2 fr 
2 
a 
4 


图 9-38 ”最早 完 成 时 间 、 最 晚 完成 时 间 和 松弛 时 间 








某 些 动作 的 松弛 时 间 为 零 ， 这 些 动作 是 关键 性 的 动作 ， 它 们 必须 按 计划 结束 。 至 少 存 
在 一 条 完全 由 零 松弛 边 组 成 的 路 径 ， 这 样 的 路 径 是 关键 路 径 (critical path) 。 


9.3.5 所 有 点 对 最 短路 径 


有 时 重要 的 是 要 找 出 图 中 所 有 顶点 对 之 间 的 最 短路 径 。 虽 然 我 们 可 以 运行 |V| 次 适当 
的 单 源 算 法 ， 但 是 如 果 要 立即 计算 所 有 的 信息 ， 我 们 多 少 还 是 愿意 有 更 快 的 解法 ， 尤 其 是 
对 于 稠密 的 图 。 

在 第 10 章 ， 我 们 将 看 到 对 赋 权 图 求解 这 种 问题 的 一 个 O(|V1) 算 法 。 虽 然 对 于 稠密 图 
它 具 有 和 运行 1V | 次 简单 ( 非 优 先 队 列 )Dijkstra 算法 相同 的 时 间 界 ， 但 是 循环 是 如 此 紧凑 以 
至 专业 化 的 所 有 点 对 算法 很 可 能 在 实践 中 更 快 。 当 然 ， 对 于 稀疏 图 更 快 的 是 运行 1V | 次 用 
优先 队列 编写 的 Dijkstra 算法 。 


9.4 网 络 流 问 题 


设 给 定 边 容量 为 c, 的 有 向 图 G 二 (VE)。 这 些 容量 可 以 代表 通过 一 个 管道 的 水 的 流 
量 或 在 两 个 交叉 路 口 之 间 马 路 上 的 交通 流量 。 有 两 个 顶点 ,一 个 是 s， 称 为 发 点 (sorce), 一 
个 是 +， 称 为 收 点 (sink)。 对 于 任意 一 条 边 (v，w)， 最 多 有 “ 流 ” 的 ci 个 单位 可 以 通过 。 
在 既 不 是 发 点 s 又 不 是 收 点 t 的 任意 项 点 v， 总 的 进入 的 流 必须 等 于 总 的 发 出 的 流 。 最 大 流 
问题 就 是 确定 从 > 到 :上 可 以 通过 的 最 大 流量 。 例 如 ， 对 于 图 9-39 中 左边 的 图 ， 最 大 流 是 5， 
如 右边 的 图 所 示 。 
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正如 问题 叙述 中 所 要 求 的 ,没有 边 负 载 超 过 它 的 容量 的 流 。 顶 点 a 有 3 个 单位 的 流 进 
入 ， 它 将 这 3 个 单位 的 流 分 转 给 c 和 ad。 顶 





(s) 
Kid 从 a 和 2 得 到 3 个 单位 的 流 ， 并 把 它们 a Ww 
结合 起 来 发 送 到 上。 一 个 顶点 可 以 以 它 喜 欢 ac : s r 
的 任何 方式 结合 和 发 送 流 ， 只 要 不 违反 边 an ki 
的 容量 以 及 保持 流 守 恒 ( 进 入 的 必须 是 流 à [^ Ó 
出 的 )。 [e Xa» 
b 3 
一 个 简单 的 最 大 流 t) 
解决 这 种 问题 的 首要 想法 是 分 阶段 进 图 9-39 ”一 个 图 (左边 ) 和 它 的 最 大 流 


行 。 我 们 从 图 G 开始 并 构造 一 个 流 图 Gj。 

Gj/ 表 示 在 算法 的 任意 阶段 已 经 到 达 的 流 。 开 始 时 Gj 的 所 有 的 边 都 没有 流 ， 我 们 希望 当 算法 
终止 时 Gj 包含 最 大 流 。 我 们 还 构造 一 个 图 G,， 称 为 残余 图 (residual graph)， 它 表示 对 于 每 
条 边 还 能 再 添加 多 少 流 。 对 于 每 一 条 边 ， 我 们 可 以 从 容量 中 减 去 当前 的 流 而 计算 出 残余 的 
Wi. G, ANH NY ME 3 F 31 (residual edge). 

在 每 个 阶段 ， 我 们 寻找 图 G PA s 到 z 的 一 条 路 径 ， 这 条 路 径 叫 作 增 长 通路 (augmen- 
ting path) 。 这 条 路 径 上 的 最 小 值 边 就 是 可 以 添加 到 路 径 每 一 边 上 的 流 的 量 。 我 们 通过 调整 
Gj 和 重新 计算 G, 做 到 这 一 点 。 当 发 现在 G PRAM s 到 1 的 路 径 时 算法 终止 。 这 个 算法 是 
不 确定 的 ， 因 为 是 随便 选择 的 从 ;到 z 的 任意 的 路 径 。 显 然 ， 有些 选择 会 比 另外 一 些 选择 
好 ， 后 面 我 们 再 处 理 这 个 问题 。 我 们 将 对 我 们 的 例子 运行 这 个 算法 。 下 面 的 图 分 别 是 G, 
Gj: 和 G,。 要 记 着 这 个 算法 有 一 个 小 缺陷 。 初 始 的 配置 见 图 9-40。 


图 9-40 图 、 流 图 以 及 残余 图 的 初始 阶段 


在 残余 图 中 有 许多 从 s 到 1 的 路 径 。 假 设 我 们 选择 ;5,5，t，d。 此 时 我 们 可 以 发 送 2 个 
单位 的 流通 过 这 条 路 径 的 每 一 条 边 。 我 们 将 采取 约定 : 一 旦 注 满 ( 使 饱和 ) 一 条 边 ， 则 这 条 
边 就 要 从 残余 图 中 除去 。 这 样 ， 我们 得 到 图 9-41. 

下 面 ， 我 们 可 以 选择 路 径 y*，a，c，:， 该 路 径 也 容许 2 个 单位 的 流通 过 。 进 行 必要 的 
调整 后 ， 我 们 得 到 图 9-42, 

唯一 剩 下 要 选择 的 路 径 是 *，&，&，:， 这 条 路 径 能 够 容纳 一 个 单位 的 流通 过 。 结 果 得 
到 图 9-43。 
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图 9-41 As, b, d, ti 加 入 2 个 单位 的 流 后 的 G、G,、G， 
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图 9-42 沿 s,a，c，t 加 入 2 个 单位 的 流 后 的 G、G,、G 
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图 9-43 s, a, d, +t 加 入 1 个 单位 的 流 后 的 G、G,;、G, 一 一 算法 终止 


由 于 + 从 s 出 发 是 不 可 达 的 ， 因 此 算法 到 此 终止 。 结 果 正 好 5 个 单位 的 流 是 最 大 值 。 为 
了 看 清 问 题 的 所 在 ， 设 从 初始 图 开始 我 们 选择 路 径 s，a，d，t， 这 条 路 径 容纳 3 个 单位 的 
流 ， 因 而 好 像 是 一 种 好 的 选择 。 然 而 选择 的 结果 却 使 得 在 残余 图 中 不 再 有 从 * 到 1 的 任何 路 
径 ， 因 此 ， 我 们 的 算法 不 能 找到 最 优 解 。 这 是 贪 楚 算 法 行 不 通 的 一 个 例子 。 图 9-44 指出 为 
什么 算法 失败 。 

为 了 使 得 算法 有 效 ， 我 们 需要 让 算法 改变 它 的 意向 。 为 此 ， 对 于 流 图 中 具有 流 /的 
每 一 条 边 (v，w)， 我 们 将 在 残余 图 中 添加 一 条 容量 为 few v), PRE, RIITA 
通过 以 相反 的 方向 发 回 一 个 流 而 使 算法 解除 它 的 决定 。 通 过 例子 最 能 看 清 这 个 问题 。 我 们 
从 原始 的 图 开始 并 选择 增长 通路 s，a，d，+， 得 到 图 0-45. 

注意 ， 在 残余 图 中 有 些 边 在 a 和 vd 之 间 有 两 个 方向 。 或 者 还 有 一 个 单位 的 流 可 以 从 a 
到 4d 导向 ,或 者 有 高 达 3 个 单位 的 流 导向 相反 的 方向 一 一 我 们 可 以 撤消 流 。 现 在 算法 找到 





246 数据 结构 与 算法 分 析 C 语言 描述 


WA 2mm s. 0. d, a. c, t, WEA d 到 a 导入 2 个 单位 的 流 算法 从 边 (a，d) 取 
E 2 个 单位 的 流 ， 因 此 本 质 上 改变 了 它 的 意向 。 图 9-46 显示 出 新 的 图 。 
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图 9-44 WRAAE s, a, d, 加 入 3 个 单位 的 流 得 到 G, Ga 
G, 一 一 算法 终止 但 解 不 是 最 优 的 
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图 9-45 使 用 正确 的 算法 治 s，Qa，d， 
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图 9-46 BRE ELE s, b, d, a, c, t A 2 个 单位 的 流 后 的 图 


在 这 个 图 中 没有 增长 通路 ， 因 此 ， 算 法 终止 。 奇 怪 的 是 ， 可 以 证 明 ， 如 果 边 的 容量 
是 有 理 数 ， 那 么 该 算法 总 以 最 大 流 终止 。 证 明 多 少 有 些 困 难 ， 也 超出 了 本 书 的 范围 。 虽 然 
例子 正好 是 无 圈 的 ， 但 这 并 不 是 算法 有 效 工作 所 必需 的 。 我 们 使 用 无 圈 图 只 是 为 了 简明 。 

如 果 容 量 都 是 整数 且 最 大 流 为 /， 那 么 ， 由 于 每 条 增长 通路 使 流 的 值 至 少 增 1， 故 三 个 
阶段 足够 ， 从 而 总 的 运行 时 间 为 0O(f。|E|)， 因 为 通过 无 权 最 短路 径 算法 一 条 增长 通路 可 
以 以 O(E|) 时 间 找 到 。 说 明 为 什么 这 个 时 间 是 坏 的 运行 时 间 的 经 典 例子 如 图 9-47 所 示 。 

最 大 流通 过 沿 每 条 边 发 送 1 000 000 并 查验 到 2 000 000 而 看 出 。 随 机 的 增长 通路 可 以 沿 
包含 由 a 和 2 连接 的 边 的 路 径 连 续 增长 。 要 是 这 种 情况 重复 发 生 ， 那 就 需要 2 000 000 条 增 


长 通路 ， 此 时 我 们 仅 用 2 就 能 通过 。 


1000000 一 一 、1000 000 





1 000 000 1000000 一 


图 9-47 经 典 的 坏 的 增长 情形 


避免 这 个 问题 的 简单 方法 是 总 选择 容许 在 流 中 最 大 增长 的 增长 通路 。 寻 找 这 样 一 条 路 径 
类 似 于 求解 一 个 赋 权 最 短路 径 问 题 ， 而 对 Dijkstra 算法 的 单线 (single-line) 修 改 将 会 完成 这 项 工 
作 。 如 果 capa NRAKA RE. IMA AWEH, OCE | log capw) 条 增长 通路 将 足以 找到 最 大 
流 。 在 这 种 情况 下 ， 由 于 对 于 增长 通路 的 每 一 次 计算 都 需要 O(| 已 |log|V| 时间， 因此 总 的 时 
间 界 为 OC|E|?*log|V|log capw)。 如 果 容 量 均 为 小 整数 ， 则 该 界 可 以 减 为 OC(|E|’log|V|)。 

另 一 种 选择 增长 通路 的 方法 是 总 选取 具有 最 少 边 数 的 路 径 ， 有 理由 设想 ， 通 过 以 这 种 
方式 选择 路 径 不 太 可 能 使 该 路 径 上 出 现 一 条 小 的 、 限 制 了 流 的 边 。 使 用 这 种 法 则 ， 可 以 证 
明 需 要 O(|E||V|) 步 增长 ,每 一 步 花费 O(C| 巨 | ) ， 再 使 用 无 权 最 短路 径 算 法 ， 产 生 运 行 时 
WR OCJEL IVD 

有 可 能 对 这 一 算法 进行 进一步 的 数据 结构 改进 ， 存 在 几 个 更 加 复杂 的 算法 。 长 期 以 来 
对 界 的 改进 降低 了 该 问题 当前 熟知 的 界 。 虽 然 尚 未 见 到 OC LE | 1V|) 算 法 的 报告 ， 但 是 一 些 
BAR OCI[EI| [V|logC|V]*/| EDO MOCIE||VI+|V | OMRKEARRHM MBS XX 
献 )。 还 有 许多 在 一 些 特殊 情形 下 非常 好 的 界 。 例 如 ， 若 图 除 发 点 和 收 点 外 所 有 的 顶点 都 有 
一 条 容量 为 1 的 人 边 或 一 条 容量 为 1 的 出 边 ， 则 该 图 的 最 大 流 可 以 以 O E| |V | tE R 
到 。 这 些 图 出 现在 许多 应 用 中 。 

产生 这 些 界 的 那些 分 析 过 程 是 相当 复杂 的 ， 并 且 还 不 清楚 最 坏 情 形 的 结果 是 如 何 与 实 
际 当 中 用 到 的 运行 时 间 发 生 关系 的 。 一 个 相关 的 甚至 更 困难 的 问题 是 最 小 值 流 (min-cost 
flow) 问 题 。 每 条 边 不 仅 有 容量 ， 而 且 还 有 每 个 单位 的 流 的 ( 价 ) 值 ， 而 问题 则 是 在 所 有 的 最 
大 流 中 找 出 一 个 最 小 ( 价 ) 值 的 流 来 。 目 前 对 这 两 个 问题 的 研究 都 在 积极 地 进行 。 


9.5 最 小 生成 树 


我 们 将 要 考虑 的 下 一 个 问题 是 在 一 个 无 向 图 中 找 出 一 棵 最 小 生成 树 (minimum spanning 
tree) 的 问题 。 这 个 问题 对 有 向 图 也 是 有 意义 的 ， 不 过 找 起 来 更 困难 。 大 体 上 ， 一 个 无 向 图 
G 的 最 小 生成 树 就 是 由 该 图 的 那些 连接 G 的 所 有 顶点 的 边 构 成 的 树 ， 且 其 总 价值 最 低 。 当 
且 仅 当 G 是 连通 的 存在 最 小 生成 树 。 虽 然 一 个 强壮 的 算法 应 该 指出 G 不 连通 的 情况 , 但 是 
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314 


我 们 还 是 假设 G 是 连通 的 ， 而 把 算法 的 健壮 性 作为 练习 留 给 读者 。 











在 图 9-48 中 第 二 个 图 是 第 一 个 图 的 最 小 生成 JU 4 一 
树 ( 碰 巧 还 是 唯一 的 ， 但 这 并 不 代表 一 般 情况 )。 本 
注意 ， 在 最 小 生成 树 中 边 的 条 数 为 |V1 一 1。 最 小 “A Na db o 
生成 树 是 一 棵 树 ， 因 为 它 无 圈 ; 因为 最 小 生成 树 【一 一 a MAJ 
包含 每 一 个 顶点 ， 所 以 它 是 生成 树 ; 此 外 ， 它 显 Wo X P 
然 是 包含 图 的 所 有 顶点 的 最 小 的 树 。 如 果 我 们 需 PR 
要 用 最 少 的 电线 给 一 所 房子 安装 电路 ， 那 就 需要 Ne 
解决 最 小 生成 树 问 题 。 = 

对 于 任意 生成 树 T， 如 果 将 一 条 不 属于 了 的 N u 
Me WEIN HEA WES. MRAR (S002 Tu E 
去 任意 一 条 边 ， 则 又 恢复 生成 树 的 特性 。 如 果 边 。 = d and 
的 值 比 除去 的 边 的 值 低 ， 那 么 新 的 生成 树 的 值 就 ne ee a 
比 原生 成 树 的 值 低 。 如 果 在 建立 生成 树 时 所 添加 oe — — VE 


的 边 在 所 有 避免 成 圈 的 边 中 值 最 小 ,那么 最 后 得 
到 的 生成 树 的 值 不 能 再 改进 ， 因 为 任意 一 条 替代 
的 边 都 将 与 已 经 存在 于 该 生成 树 中 的 一 条 边 至 少 具 有 相同 的 值 。 它 指出 ， 对 于 最 小 生成 树 
这 种 贪 欲 是 成 立 的 。 我 们 介绍 两 种 算法 ， 它 们 的 区 别 在 于 最 小 ( 值 的 ) 边 如 何 选取 上 。 


图 9-48 图 G 和 它 的 最 小 生成 树 


9.5.1 Prim 算法 


计算 最 小 生成 树 的 一 种 方法 是 使 其 连续 地 一 步 步 长 成 。 在 每 一 步 ， 都 要 把 一 个 节点 当 
作 根 并 往 上 加 边 ， 这 样 也 就 把 相关 联 的 顶点 加 到 增长 中 的 树 上 。 

在 算法 的 任意 时 刻 ， 我 们 都 可 以 看 到 一 个 已 经 添加 到 树 上 的 顶点 集 ， 而 其 余 项 点 尚未 
加 到 这 棵 树 中 。 此 时 ， 算 法 在 每 一 阶段 都 可 以 通过 选择 边 (u，wv) 使 得 (uw，wv) 的 值 是 所 有 u 
在 树 上 但 不 在 树 上 的 边 的 值 中 的 最 小 者 而 找 出 一 个 新 的 顶点 并 把 它 添加 到 这 棵 树 中 。 
图 9-49 指 出 该 算法 如 何 从 vi 开始 构建 最 小 生成 树 。 开 始 时 ，wi 在 构建 中 的 树 上 ， 它 作为 树 
的 根 但 是 没有 边 。 每 一 步 添 加 一 条 边 和 一 个 顶点 到 树 上 。 

我 们 可 以 看 到 ，Prim 算法 基本 上 和 求 最 短路 径 的 Dijkstra 算法 一 样 ， 因 此 和 前 面 一 样 ， 
我 们 对 每 一 个 顶点 保留 值 4, 和 pp, 以 及 一 个 指标 ， 标 示 该 项 点 是 已 知 的 (known) 还 是 未 知 的 
(unknown)。 这 里 ，d, 是 连接 v 到 已 知 顶 点 的 最 短 弧 的 权 ， 而 p, 则 是 导致 4d, 改变 的 最 后 的 
顶点 。 算 法 的 其 余部 分 完全 一 样 ， 只 有 一 点 不 同 : 由 于 d, 的 定义 不 同 ， 因 此 它 的 更 新 法 则 
也 不 同 。 事实 上 ， 更 新 法 则 比 以 前 更 简单 :在 选取 每 一 个 顶点 vv 后， 对 于 每 一 个 与 v 邻接 
WAAAY w, d,=min(dys c... 

表 的 初始 状态 由 图 9-50 指出 。 选 取 vi ， 更 新 u, v, vuo HRUE 9-51 所 示 。 下 一 个 
顶点 选取 w ， 每 一 个 顶点 都 与 wv 邻 接 。wi 不 考虑 ， 因 为 它 是 已 知 的 。w 不 变 ， 因 为 d, =2 
而 且 从 wv, 到 vw; 的 边 的 值 是 3; 所 有 其 他 的 顶点 都 被 更 新 。 图 9-52 显示 得 到 的 结果 。 下 一 个 


要 选取 的 顶点 是 vw。 这 并 不 影响 任何 距离 。 然 后 选取 说 ， 它 影响 到 vw 的 距离 ， 见 图 9-53. 3€ 
取 vw; 得 到 图 9-54，w; 的 选取 迫使 o, RI vw; 进行 调整 。 然 后 分 别 选取 w 和 v;， 算 法 完成 。 
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图 9-49 在 每 一 步 之 后 的 Prim 算法 


最 后 的 表 在 图 9-55 中 给 出 。 生 成 树 的 边 可 以 从 该 表 中 读 出 : Cos vios Cus v. 
(3 Ui)» Cus » U7) 5 Cus > Ur)» Cin» U1 R 生成 树 总 的 值 是 16. 





























































































































p——————— =] 

v Known d, py | v Known d, py v | Known d, p, 
= l- | - ee 

vi OP Die 0 E 1 0 0 | 4d 0 0 
V) 0 e$ 0 | || v2 0 2 n | v2 0 2 ti 
v3 0 ” 0 | v3 9 4 Ui || Us 0 2 Ua 

|| "4 0 - 0 | Va 0 1 ti Us 1 1 wv | 
| vs 0 * 0| Vs 0 æ 0 Us 0 7 Ww 
Us 0 * 0 ve 0 cx 0 Ug 0 8 va 
v7 0 m 0 v; 0 oc 0 v7 0 4 V4 

图 9-50 #4 Prim 算法 中 使 用 图 9-51 在 v1 声明 为 已 知 图 9-52 在 vs 声明 为 已 知 后 的 表 
的 表 的 初始 状态 后 的 表 

= = 3 

v Known d, p. Known d, p, | v Known d, pr | 

| | | v 1 0 0 | 

v) 1 2 vj 1 2 m" v) 1 2 s | 
Us 1 2 V4 1 2 V4 Us 1 2 V4 

Ua 1 1 Vy T 1 Ui V4 1 1 vi | 
vs 0 7 4 0 B w Us 1 6 wv; 
ve 0 $5 v3 0 1 w| Ve 1 1 wv 
v; 0 4 u 1 4 wi v; 1 4 w 


























图 9-53 在 和 内 先后 声明 图 9-54 在 声明 为 已 知 图 9-55 在 ve 和 vs 选取 后 的 表 
为 已 知 后 的 表 后 的 表 (Prim 算法 终止 
该 算法 整个 的 实现 实际 上 和 Dijkstra 算法 的 实现 是 一 样 的， 对 于 Dijkstra 算法 分 析 所 做 
的 每 一 件 事 都 可 以 用 到 这 里 。 不 过 要 注意 ，Prim 算法 是 在 无 向 图 上 运行 的 ， 因 此 当 编写 代 
码 的 时 候 要 记 住 把 每 一 条 边 都 要 放 到 两 个 邻接 表 中 。 不 用 堆 时 的 运行 时 间 为 OCIV L5. E 


对 于 稠密 的 图 来 说 是 最 优 的 。 使 用 二 叉 堆 的 运行 时 间 是 OE | log IV |). Xt TB LR EL 
是 一 个 好 的 界 。 


9.5.2 Kruskal 算法 
第 二 种 贪 焚 策 略 是 连续 地 按照 最 小 的 权 选 择 边 ， 并 且 当 所 选 











的 边 不 产生 图 时 就 把 它 作为 所 取 定 的 边 。 该 算法 对 于 前 面 例子 的 。 一 一 一 
实行 过 程 如 图 9-56 所 示 。 (vev) 1 接受 
ERE, Kruskal 算法 是 在 处 理 一 个 森林 一 树 的 集合 。 EA a 2 HE | 
的 时 候 ， 存 在 | 六 | 棵 单 节点 树 ， 而 添加 一 边 则 将 两 棵 树 合并 成 一 | 3 BA 
棵 树 。 当 算法 终止 的 时 候 ， 就 只 有 一 棵 树 了 ， 这 棵 树 就 是 最 小 生 oc RE 
成 树 。 图 9-57 显示 边 被 添加 到 森林 中 的 顺序 。 Lae em 








当 添 加 到 森林 中 的 边 足 够 多 时 算法 终止 。 实 际 上 ， 算 法 就 是 
要 决定 边 (u，v) 应 该 添加 还 是 应 该 舍弃 。 前 一 章 中 的 Union/ 
Find 算法 是 适用 于 这 里 的 数据 结构 。 


图 9-56 Kruskal 算法 施 
于 图 G 的 过 程 
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图 9-57 ”在 每 一 步 之 后 的 Kruskal 算法 
我 们 用 到 的 一 个 恒定 的 事实 是 ， 在 算法 实施 的 任意 时 刻 ， 两 个 顶点 属于 同一 个 集合 当 
且 仅 当 它们 在 当前 的 生成 森林 (spanning forest) 中 连通 。 因 此 ， 每 个 顶点 最 初 是 在 它 自己 的 


集合 中 。 如 果 u 和 w 在 同一 个 集合 中 ,那么 连接 它们 的 边 就 要 舍弃 ， 因 为 由 于 它们 已 经 连 
通 了 ， 因 此 再 添加 边 (u，wv) 就 会 形成 一 个 圈 。 如 果 这 两 个 顶点 不 在 同一 个 集合 中 ， 则 将 该 
边 加 入 ， 并 对 包含 顶点 u 和 w 的 这 两 个 集合 实施 一 次 Union。 容 易 看 到 ， 这 样 将 保持 集合 
不 变性 ， 因 为 一 旦 边 (u，wv) 添 加 到 生成 森林 中 ， 若 w 连通 到 而 x EGF v. DU] x RI xo 必 
然 是 连通 的 ， 因 此 属于 相同 的 集合 。 

固然 ， 将 边 排序 可 便于 选取 ， 不 过 ， 用 线性 时 间 建 立 一 个 堆 则 是 更 好 的 想法 。 此 时 ， 
DeleteMin 将 使 得 边 依 序 得 到 测试 。 典 型 情况 下 ， 在 算法 终止 前 只 有 一 小 部 分 边 需 要 测 


$903 Hit 251 


试 ， 尽 管 必须 尝试 所 有 的 边 的 情况 总 是 有 可 能 的 。 例 如 ， 假 设 还 有 一 个 顶点 vs 以 及 值 为 
100 的 边 (w ，w)， 那 么 所 有 的 边 就 会 都 要 考察 到 。 图 9-58 中 的 函数 Kruskal 可 以 找 出 一 
棵 最 小 生成 树 。 因 为 一 条 边 由 三 部 分 数据 组 成 ， 所 以 在 某 些 机 器 上 把 优先 队列 实现 成 指向 
边 的 指针 数组 比 实现 成 边 的 数组 更 为 有 效 。 这 种 实现 的 效果 在 于 ， 为 重新 排列 堆 ， 需 要 移 
动 的 只 有 那些 指针 ， 而 大 量 的 记录 则 不 必 移 动 。 











void 
Kruskal( Graph G ) 
{ 
int EdgesAccepted; 
DisjSet S; 
PriorityQueue H; 
Vertex U, V; 
| SetType Uset, Vset; 
| Edge E; 
| /* 1*/ Initialize( S ); 
/* 2*/ ReadGraphIntoHeapArray( G, H ); 
/* 3*/ BuildHeap( H ); 
JE 4*/ EdgesAccepted - 0; 
/[* 5*/ while( EdgesAccepted « NumVertex - 1 ) 
{ 
/* 6*/ E = DeleteMin( H ); /* E = (U,V) */ 
/* 7*/ Uset = Find( U, S ) 
/* 8*/ Vset = Find( V, S + 
7* 9*/ if( Uset !- Vset ) 
{ 
/* Accept the edge */ 
/*10*/ EdgesAccepted++; 
/*11*/ SetUnion( S, USet, VSet ); 
} 
} 
} 





图 9-58 Kruskal 算法 的 伪 代 码 


该 算法 的 最 坏 情 形 运 行 时 间 为 O(|E|log|E|), 它 受 堆 操 作 控 制 。 注 意 ， 由 于 |E|= 
O(IV1*)， 因 此 这 个 运行 时 间 实 际 上 是 O(|Ellog|V|)。 在 实践 中 ,该 算法 要 比 这 个 时 间 
界 指示 的 时 间 快 得 多 。 


9.6 深度 优先 搜索 的 应 用 


深度 优先 搜索 (depth-first search) 是 对 先 序 遍历 (preorder traversal) 的 一 般 化 。 我 们 从 
某 个 顶点 久 开 始 处 理 v， 然 后 递归 地 遍历 所 有 与 v 邻接 的 顶点 。 如 果 这 种 过 程 是 对 一 棵 树 进 
fi. 那么 ,由 于 |E| 二 @(IV|)， 因 此 该 树 的 所 有 的 顶点 在 总 时 间 O(IE|) 内 都 将 被 系统 地 
访问 到 。 如 果 我 们 对 任意 的 图 进行 该 过 程 ， 那么 为 了 避免 圈 我 们 需要 小 心 仔 细 。 为 此 ， 当 
我 们 访问 一 个 顶点 的 时 候 ， 由 于 当时 已 经 到 了 该 点 处 ， 因 此 可 以 标记 该 点 是 访问 过 的 ， 
并 且 对 于 尚未 被 标记 的 所 有 邻接 顶点 递归 调用 深度 优先 搜索 。 我 们 假设 ， 对 于 无 向 图 ， 每 
条 边 (v，w) 在 邻接 表 中 出 现 两 次 : 一 次 是 (v，w)， 另 一 次 是 (w，v)。 图 9-59 中 的 函数 执 
行 一 次 深度 优先 搜索 (此 外 绝对 什么 也 不 做 )， 从 而 是 一 个 一 般 风 格 的 模板 。 

(全 局 ) 布 尔 型 数组 Visiteqd[] 初 始 化 成 false。 通 过 只 对 那些 尚未 访问 的 节点 递归 调 


319 


320 


该 函数 ， td 如 果 图 是 无 向 的 且 不 连通 的 ,或 是 有 向 的 但 非 
ides 这 种 方法 可 能 会 访问 不 到 某 些 节点 。 此 时 ， 我 
们 搜索 一 个 未 标记 的 节点 ， 然 后 应 用 深度 优先 遍历 ， 并 继 
续 这 个 过 程 直 到 不 存在 未 标记 的 节点 为 止 ? 。 因 为 该 方法 





voi 
| ud Vertex V ) 
{ 


1 
Visited[ V ] = True; | 
| 
| 


保证 每 一 条 边 只 访问 一 次 ， 所 以 只 要 使 用 邻接 表 ， 则 执行 for ved w 1). 
遍历 的 总 时 间 就 是 OC(IE| 十 |V|)。 i Dfs( w ); 
9.6.1 无 向 图 图 9-59 深度 优先 搜索 模板 


当 且 仅 当 从 任意 节点 开始 的 深度 优先 搜索 访问 到 每 一 个 节点 ， 无 向 图 是 连通 的 。 因 为 
这 项 测试 应 用 起 来 非常 容易 ， 所 以 假设 我 们 处 理 的 图 都 是 连通 的 。 如 果 它 们 不 连通 ， 那 么 
我 们 可 以 找 出 所 有 的 连通 分 支 并 将 我 们 的 算法 依次 应 用 于 每 个 分 支 。 

作为 深度 优先 搜索 的 一 个 例子 ， 设 在 图 9-60 中 我 们 从 A 点 开始 。 此 时 ， 标 记 A 为 访问 
过 的 并 递归 调用 Dfs(B)。Dfs(B) 标 记 B 为 访问 过 的 并 递归 调用 Dfs(C)。Dfs(C) 标 记 C 
为 访问 过 的 并 递归 调用 D£sCD), D£sCDO38 8|] A ALB, 但 是 这 两 个 节点 都 已 标记 了 ， 因 此 
没有 递归 调用 可 以 进行 。Dfs(D) 也 看 到 C 是 邻接 的 顶点 , (AC 也 标记 过 了 ， 因 此 在 这 里 也 
没有 递归 调用 进行 ， 于 是 Dfs(D) 返 回 到 Dfs(C)。Dfs(C) 看 到 B 是 邻接 点 ， 忽 略 它 ， 并 
发 现 以 前 没 看 见 的 顶点 玉 也 是 邻接 点 ， 因 此 调用 Dfs(E)。Dfs(E) 将 玉 作 标记 ， 忽略 A 和 
B， 并 返回 到 Dfs(C)。Dfs(C0C) 返 回 到 Dfs(B)。Dfs(B) 忽 略 A AD 并 返回 。Dfs(A) 忽 略 
D 和 上 且 返回 。( 我 们 实际 上 已 经 接触 每 条 边 两 次 ,一 次 是 作为 边 (v，w)， 再 一 次 是 作为 
Ww, v), 但 这 实际 上 是 每 个 邻接 表 项 接触 一 次 。) 
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图 9-60 ”一 个 无 向 图 
我 们 以 图 形 来 描述 深度 优先 生成 树 (depth-first spanning tree) 的 步骤 。 该 树 的 根 是 A. 
是 第 一 个 访问 的 项 点。 图 中 的 每 一 条 边 (v，w) 都 出 现在 树 上 。 如 果 当 我 们 处 理 (v，w) 时 发 
M 多 是 未 标记 的 ， 或 当 我 们 处 理 (w，wv) 时 发 现 v 是 未 标记 的 ， 那么 我 们 就 用 树 的 一 条 边 表 





O ”其 实现 的 一 种 有 效 方法 是 从 uw 开始 深度 优先 搜索 。 如 果 我 们 需要 重新 开始 深度 优先 搜索 ， 则 考虑 一 个 未 标记 的 
顶点 序列 o. vea. cns KP -1 是 最 后 一 次 深度 优先 搜索 开始 时 的 顶点 。 这 保证 整个 算法 只 花费 OC] V | ) 时 
间 查 找 那 些 使 新 的 深度 优先 搜索 树 开始 的 顶点 。 


$93 图 论 算 法 253 


示 它 。 如 果 当 我 们 处 理 (z，z) 时 发 现世 已 被 标记 ， 并 且 当 我 们 处 理 ( 双 ，z) 时 发 现 迷 也 已 有 
标记 ， 那 么 我 们 就 画 一 条 虚线 ， 并 称 之 为 背 向 边 (back edge)， 表 示 这 条 “ 边 ” 实 际 上 不 是 
树 的 一 部 分 。 图 9-60 中 的 图 的 深度 优先 搜索 在 图 9-61 PRH, 


( A) 
E al 
Pd 





图 9-61 上 图 的 深度 优先 搜索 
树 将 模拟 我 们 执行 的 遍历 。 只 使 用 树 的 边 对 该 树 的 先 序 编号 告诉 我 们 这 些 顶 点 被 标记 
的 顺序 。 如 果 图 不 是 连通 的 ， 那 么 处 理 所 有 的 节点 (和 边 ) 则 需要 多 次 调用 DES. 每 次 都 生 
成 一 棵 树 ， 整 个 集合 就 是 深度 优先 生成 森林 (depth-first spanning forest)。 


9.6.2 双 连 通 性 
一 个 连通 的 无 向 图 如 果 不 存在 被 删除 之 后 使 得 剩 下 的 图 不 再 连通 的 顶点 ， 那 么 这 样 的 


无 向 连通 图 就 称 为 双 连 通 (biconnected) 的 。 上 例 中 的 图 是 双 连 通 的 。 如 果 例 中 的 节点 是 计 
算 机 ， 边 是 链 路 ， 那 么 ， 若 有 任意 一 台 计算 机 出 故障 而 不 能 运行 ， 则 网 络 邮 件 并 不 受 影响 ， 
当然 ， 与 这 台 坏 计算 机 有 关 的 邮件 除外 。 类 似 地 ， 如 果 一 个 公共 运输 系统 是 双 连 通 的 ， 那 
么 ， 若 某 个 站 点 被 破坏 ， 则 用 户 总 可 选择 另外 的 旅行 路 径 

如 果 一 个 图 不 是 双 连 通 的 ， 那么 , 将 一 
其 删除 使 图 不 再 连通 的 那些 顶点 叫 作 割 点 C») B (^) 
(articulation point), iX J£ 5 à fE YF 4 
用 中 是 很 重要 的 。 图 9-62 不 是 双 连 通 的 : | 





顶点 C 和 了 是 割 点 。 删 除 顶 点 D 使 图 G OS D 

不 连通 ， 而 删除 顶点 D WEE 和 下 从 图 ee 

G 的 其 余部 分 断 离 。 k Ry es 
深度 优先 搜索 提供 一 种 找 出 连通 图 中 Lu Jury 

的 所 有 制 点 的 线性 时 间 算法 。 首 先 ， 从 图 $a (E) 

中 任意 顶点 开始 ， 执 行 深度 优先 搜索 并 在 aaa b 

顶点 被 访问 时 给 它们 编号 。 对 于 每 一 个 顶 本 


点 v 我们 称 其 先 序 编号 为 Num(v)。 然 后 ， 对 于 深度 优先 搜索 生成 树 上 的 每 一 个 顶点 vw， 计 
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算 编号 最 低 的 顶点 ， 我 们 称 之 为 Low(v)， 该 点 从 v 开 始 通过 树 的 零 条 或 多 条 边 且 可 能 还 有 
一 条 背 向 边 而 (以 该 序 ) 达 到 。 图 9-63 中 的 深度 优先 搜索 树 首先 指出 先 序 编号 ， 然 后 指出 在 
上 述 法 则 下 可 达 的 最 低 编号 项 点 。 
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图 9-63 上 图 的 深度 优先 树 ， 节 点 标 有 Num 和 Low 


从 A、B 和 C 开始 的 可 达 最 低 编 号 顶点 为 1(A)， 因 为 它们 都 能 够 通过 树 的 边 到 D. f^ 
后 在 由 一 条 背 向 边 回 到 A。 我 们 可 以 通过 对 该 深度 优先 生成 树 执行 一 次 后 续 遍 历 有 效 地 算 
出 Low。 根 据 low 的 定义 可 知 Low(v) 是 

l. Num(v) 

2. MAA Wo, w) PARK Num(w) 

3. MATA Co. w) PARK Low(w) 
的 最 小 者 。 

第 一 种 方法 是 不 选取 边 ， 第 二 种 方法 是 不 选取 树 的 边 而 是 选取 一 条 背 向 边 ， 第 三 种 方 
法 则 是 选择 树 的 某 些 边 以 及 可 能 还 有 一 条 背 向 边 。 第 三 种 方法 可 用 一 个 递归 调用 简明 地 描 
述 。 由 于 我 们 需要 对 v 的 所 有 儿子 计算 出 Low 值 后 才能 计算 Low(v)， 因 此 这 是 一 个 后 序 遍 
历 。 对 于 任意 一 条 边 (v，w)， 我 们 只 要 检查 Num(v) 和 Num(w) 就 可 以 知道 它 是 树 的 一 条 边 
还 是 一 条 背 向 边 。 因 此 ，Low(v) 容 易 计 算 : 我 们 只 需 扫 描 wv 的 邻接 表 ， 应 用 适当 的 法 则 ， 
并 记 住 最 小 值 。 所 有 的 计算 花费 O(IE| 十 |V|) 时 间 。 

剩 下 要 做 的 就 是 利用 这 些 信息 找 出 所 有 的 割 点 。 根 是 制 点 当 且 仅 当 它 有 多 于 一 个 的 儿 
子 ， 因 为 如 果 它 有 两 个 儿子 ,那么 删除 根 则 使 得 节点 不 连通 而 分 布 在 不 同 的 子 树 上 ;如果 
根 只 有 一 个 儿子 ， 那 么 除去 该 根 只 不 过 断 离 该 根 。 对 于 任何 其 他 顶点 v， 它 是 割 点 当 且 仅 当 
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它 有 某 个 儿子 ww 使 得 Low(w) 宇 Num(v)。 注 意 ， 这 个 条 件 在 根 处 总 是 满足 的 ; 因此 ， 需 要 
进行 特别 的 测试 。 

当 我 们 考察 算法 确定 的 割 点 ( 即 C 和 DD) 时 ,证 明 的 当 部 分 是 明显 的 。D 有 一 个 儿子 E， 
H Low(E)>Num(D), 二 者 都 是 4。 因 此 ， 对 EE 来 说 只 有 一 种 方法 到 达 D 上 面 的 任何 一 点 ， 
那 就 是 要 通过 D。 类 似 地 ,，C 也 是 一 个 割 点 ， 因 为 Low(G) 宇 Num(C)。 为 了 证 明 该 算法 正 
确 ， 我们 必须 证 明 论 断 的 仅 当 部 分 成 立 ( 即 ， 它 找到 所 有 的 割 点 )。 我 们 把 它 留 作 一 道 练习 。 
作为 第 二 个 例子 ,我 们 指出 (图 9-64) 同 样 在 这 个 图 上 应 用 该 算法 在 顶点 C 开始 深度 优先 搜 
索 的 结果 。 





图 9-64 在 C 开始 深度 优先 搜索 所 得 到 的 深度 优先 树 


最 后 ， 我 们 给 出 伪 代 码 实现 该 算法 。 为 使 程序 简单 设 数组 Visited L1 W tR WE X 
false), Num[], Low[] Ñl Parent [] 为 全 局 变量 。 我 们 还 要 有 一 个 全 局 变量 叫 作 Count- 
er， 为 给 先 序 遍历 编号 Num[] 赋 值 ， 将 Counter 初始 化 为 1。 通常 这 不 是 一 个 好 的 程序 设 
计 实 践 ， 不 过 ， 包 含 所 有 的 声明 和 传递 那些 额外 的 参数 将 会 模糊 程序 的 逻辑 结构 。 我 们 还 
将 省 略 对 根 的 容易 实现 的 测试 。 

正如 我 们 已 经 提 到 的 ， 该 算法 可 以 通过 





执行 一 趟 先 序 遍 历 计算 Num 而 后 一 趟 后 序 oe Num and compute Parents */ 
遍历 计算 Low 来 实现 。 第 三 趟 遍历 可 以 用 ia Vertex V) 
来 检验 哪些 顶点 满足 割 点 的 标准 。 然 而 ， 执 E et 
行 三 趟 遍历 是 一 种 浪费 。 第 一 趟 如 图 9-65 /* 1*/ Num[ V ] = Counter++; 
所 一 /* 2*/ Visited[ V ] = True; 

不 。 /* 3*/ for each W adjacent to V 

第 二 趟 和 第 三 趟 遍历 都 是 后 序 遍历 , 可 | ^ 7 neha 

以 通过 图 9-66 中 的 代码 来 实现 。 第 8 行 处 | ^. ei, peaa a hi 
理 一 个 特殊 的 情况 。 如 果 w 邻接 到 vw， 那么 j 











递归 调用 z 将 发 现 v BHA wu XE 
条 背 向 边 ， 而 只 是 一 条 已 经 考虑 过 上 且 需要 忽 图 9-65 ”对 顶点 的 Num 赋值 的 例 程 ( 伪 代 码 ) 
略 的 边 。 否 则 ， 该 过 程 计算 出 Low[] 和 Num[] 成 员 的 最 小 值 ， 正 如 算法 指定 的 那样 。 
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/* Assign Low; also check for articulation points */ 
void 
AssignLow( Vertex V ) 
Vertex W; 
AE AF Low[ V ] = Num[ V]; /* Rule 1 */ 
FELN for each W adjacent to V 
{ 
/* 3*/ if( Num[ W ] > Num[ V ] ) /* Forward edge */ 
{ 
ft Ay AssignLow( W ); 
fe See ifC Low[ W ] >= Num[ V] D 
f= ory printf( "Xv is an articulation point\n", v ); 
/[* 7*/ Low[ V ] = MinC Low[ V ], Low[ W ] 5; /* Rule 3 */ 
} 
else 
f*® :8*/ if( Parent[ V ] !=W) /* Back edge */ 
/* 9*/ Low[ V ] = MinC Low[ V ], Num[ W ] 5; /* Rule 2 */ 
} 
} 











图 9-66 计算 Low 并 检验 是 否 割 点 的 伪 代 码 ( 忽 略 对 根 的 检验 ) 


ea 不 存在 一 个 遍历 一 定 是 先 序 遍历 或 后 序 遍 历 的 法 则 。 在 递归 调用 前 和 递归 调用 后 都 有 
" 可 能 对 两 者 进行 处 理 。 图 9-67 中 的 过 程 将 两 个 例 程 AssignNum 和 AssignLow 结合 成 一 种 
325| 直接 的 方式 得 到 函数 Pindart. 





void 
FindArt( Vertex V ) 
{ 
Vertex W; 
/* 1*/ Visited[ V ] = True; 
/* 2*/ Low[ V ]  Num[ V ] = Counter; /* Rule 1 */ 
+ Bh for each W adjacent to V 
{ 
/* 4*/ if( !Visited[ W ] ) /* Forward edge */ 
{ 
/[* S*/ Parent[ W] = V; 
y* 6*/ FindArt( W ); 
JX TET if( Low[ W ] >= Num[ V ] D 
/* 8*/ printf( "Xv is an articulation point\n", v ); 
y= 9*7 Low[ V ] = Min( Low[ V ], Low[ W ] ); /* Rule 3 */ 
} 
else 
/*10*/ if( Parent[ V ] != W) /* Back edge */ 
/*11*/ Low[ V ] = MinC Low[ V J], Num[ Ww ] ); /* Rule 2 */ 
} 
} 











图 9-67 ”在 一 次 深度 优先 搜索 (忽略 对 根 的 检测 ) 中 对 割 点 的 检测 ( 伪 代 码 ) 


9.6.3 欧 拉 回路 


考虑 图 9-68 中 的 三 个 图 。 一 个 流行 的 游戏 是 用 钢笔 重 画 这 些 图 ， 每 条 线 恰 好 画 一 次 。 
在 画图 的 时 候 钢笔 不 要 从 纸 上 离 开 。 作 为 一 个 附加 的 问题 ， 要 使 钢笔 结束 画图 在 开始 画 
图 时 的 起 点 上 。 该 游戏 有 一 个 非常 简单 的 解法 。 如 果 你 想 尝试 求解 该 问题 ， 那 么 现在 就 


可 以 试 一 试 。 
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9-68 三 幅 图 画 


第 一 个 图 仅 当 起 点 在 左下 角 或 右 下 角 时 可 以 画 出 ， 而 且 不 可 能 结束 在 起 点 处 。 第 二 个 
图 容易 画 出 ， 它 的 终止 点 和 起 点 相同 ， 但 是 ， 第 三 个 图 在 游戏 的 限制 条 件 下 根本 画 不 出 来 。 

我 们 可 以 通过 给 每 个 交点 指定 一 个 顶点 而 把 这 个 问题 转化 成 图 论 问 题 。 此 时 ， 图 的 边 
可 以 自然 的 方式 规定 ， 如 图 9-69 所 示 。 
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图 9-69 将 游戏 转化 成 图 


将 问题 转化 之 后 ， 我 们 必须 在 图 中 找 出 一 条 路 径 ， 使 得 该 路 径 访问 图 的 每 条 边 恰好 一 
次 。 如 果 我 们 要 解决 “附加 的 问题 ”， 那 么 就 必须 找到 一 个 圈 ， 该 圈 经 过 每 条 边 恰 好 一 
这 种 图 论 问题 在 1736 年 由 欧 拉 解决 ， 它 标志 着 图 论 的 诞生 。 根 据 特定 问题 的 叙述 不 同 ， 这 
种 问题 通常 叫 作 欧 拉 路 径 ( 有 时 称 欧 拉 环 游 Euler tour) 或 欧 拉 回路 (Euler circuit) 问题 。 
虽然 欧 拉 环 游 和 欧 拉 回 路 问题 稍 有 不 同 ， 但 是 却 有 相同 的 基本 解 。 因 此 ， 在 这 一 节 我 们 将 
考虑 欧 拉 回路 问题 。 

能 够 做 的 第 一 个 观察 是 ， 其 终点 必须 终止 在 起 点 上 的 欧 拉 回路 只 有 当 图 是 连通 的 并 且 
每 个 顶点 的 度 ( 即 ， 边 的 条 数 ) 是 偶数 时 才 有 可 能 存在 。 这 是 因为 ,在 欧 拉 回路 中 ， 一 
点 有 边 进 入 ， 则 必然 有 边 离开 。 如 果 任 意 顶 点 v 的 度 为 奇数 ,那么 实际 上 我 们 早晚 将 会 达 
到 这 样 一 种 地 步 ， 即 只 有 一 条 进入 v 的 边 尚未 访问 到 ， 若 沿 该 边 进 入 v 点 ， 那么 我 们 只 能 
停 在 顶点 v. 不 可 能 再 出 来 。 如 果 恰 好 有 两 个 顶点 的 度 是 奇数 ， 那 么 当 我 们 从 一 个 奇数 度 的 
顶点 出 发 最 后 终止 在 另 一 个 奇数 度 的 顶点 时 ， 仍 然 有 可 能 得 到 一 个 欧 拉 环 游 。 这 里 ， 欧 拉 
环 游 是 必须 访问 图 的 每 一 边 但 最 后 不 一 定 必 须 回 到 起 点 的 路 径 。 如 果 奇 数 度 的 顶点 多 于 两 
个 ， 那么 欧 拉 环 游 也 是 不 可 能 存在 的 。 

上 一 段 的 观察 给 我 们 提供 了 欧 拉 回 路 存在 的 一 个 必要 条 件 。 不 过 ， 它 并 未 告诉 我 们 满 
足 该 性 质 ee 个 欧 拉 回路 ， 也 没有 给 我 们 如 何 找 出 欧 拉 回路 的 指导 。 
事实 上 ， 这 个 必要 条 件 也 是 充分 的 。 就 是 说 ， 所 有 顶点 的 度 均 为 偶数 的 任何 连通 图 必然 有 
a 不 仅 如 此 ， 我们 还 可 以 以 线性 时 间 找 出 这 样 一 条 回路 。 

由 于 我 们 可 以 用 线性 时 间 检 测 这 个 充分 必要 条 件 ， 因 此 可 以 假设 我 们 知道 存在 一 条 欧 
拉 回 路 。 此 时 ， 基 本 算法 就 是 执行 一 次 深度 优先 搜索 。 有 大 量 “ 明 显 的 ”解决 方案 但 是 却 
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都 行 不 通 ， 我 们 罗列 了 一 些 在 练习 中 。 

”主要 问题 在 于 ， 我 们 可 能 只 访问 了 图 的 一 部 分 而 提前 返回 到 起 点 。 如 果 从 起 点 出 发 的 

Md 所 有 边 均 已 用 完 ， 那么 图 中 就 会 有 部 分 省 历 不 到 。 最 容易 的 补 玫 方法 是 找 出 有 尚未 访问 的 

327, 边 的 路 径 上 的 第 一 个 顶点 ， 并 执行 另外 一 次 深度 优先 搜索 。 这 将 给 出 另外 一 个 回路 ， 把 它 
拼接 到 原来 的 回路 上 。 继 续 该 过 程 直到 所 有 的 边 都 遍历 到 为 止 。 

作为 一 个 例子 ， 考 虑 图 9-70。 容 易 看 出 ， 这 个 图 有 一 个 欧 拉 回路 。 设 从 顶点 5 开始 ， 我 

们 遍历 5，4，10，5， 此 时 我 们 已 无 路 可 走 ， 图 的 大 部 分 都 还 未 遍历 到 。 情 况 如 图 9-71 所 示 。 


"m 


图 9-70 欧 拉 回路 问题 的 图 
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B] 9-71 #5, 4, 10, 5 后 剩 下 的 图 


此 时 ,我 们 从 顶点 4 继续 进行 ， 它 仍然 还 有 没 用 到 的 边 。 结 果 ， 又 得 到 路 径 4，1，3， 
7，4，11，10,，7,，9，3，4。 如 果 我 们 把 这 条 路 径 拼 接 到 前 面 的 路 径 5. 4. 10. 5 E. JB 
从 我 们 就 得 到 一 条 新 的 路 径 5, 4, 1, 3, 7, 4, 11, 10, 7, 9, 3, 4, 10, 5, 

此 后 ， 剩 下 的 图 表示 在 图 9-72 中 。 注 意 ， 在 这 个 图 中 ， 所 有 的 顶点 的 度 必然 都 是 偶数 ， 
因此 ， 我 们 保证 能 够 找到 一 个 圈 再 拼接 上 。 剩 下 的 图 可 能 不 是 连通 的 ， 但 这 并 不 重要 。 路 径 
上 存 有 未 访问 的 边 的 下 一 个 顶点 是 3。 此 时 可 能 的 回路 可 以 是 3，2，8，9，6，3。 当 拼接 进来 
之 局 SBI S. 4. 1. 3. Be Ss 9, 6, Ss 7, 44 11; 10, 7, 9, 3, 4, 10, 5, 


exl - 


图 '9:72 #5, 4, 1, 3, 4, 11, 10, 7, 9, 3, 4, 10, 5 后 的 图 





剩 下 的 图 在 图 9-73 中 。 在 该 路 径 上 ， 带 有 未 遍历 边 的 下 一 个 顶点 是 9， 算 法 找到 回路 
9，12，10，9。 当 把 它 拼接 到 当前 路 径 中 时 ， 我 们 得 到 回路 5，4，1，3，2，8，9，12， 
10, 9, 6, 3, 7, 4, 11, 10, 7, 9, 3, 4, 10, 5, SrA Ai Bh okie at, BREA, 
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我 们 得 到 一 个 欧 拉 回路 。 


D 
© © 2: (4) © 
© Q 
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UW 
9-73 ERE 5, 4, 1, 3, 2, 8, 9, 6, 3, 7, 4, 11, 10, 7, 9, 3, 4, 10, SAM Pe 


为 使 算法 更 有 效 ， 必 须 使 用 适当 的 数据 结构 。 我 们 将 概述 想法 而 把 实现 方法 留 作 练习 。 
为 使 拼接 简单 ， 应 该 把 路 径 作为 一 个 链表 保留 。 为 避免 重复 扫描 邻接 表 ， 对 于 每 一 个 邻接 表 
我 们 必须 保留 一 个 指向 最 后 扫描 到 的 边 的 指针 。 当 拼接 一 个 路 径 时 ， 必 须 从 拼接 点 开始 搜索 
新 顶点 ， 从 这 个 新 顶点 进行 下 一 轮 深度 优先 搜索 。 这 将 保证 在 整个 算法 期 间 对 顶点 搜索 阶段 
所 进行 的 全 部 工作 量 为 O(|E|)。 使 用 适当 的 数据 结构 ， 算 法 的 运行 时 间 为 O(|E| 十 |V1)。 

一 个 非常 相似 的 问题 是 在 无 向 图 中 寻找 一 个 简单 的 圈 ， 该 圈 通 过 图 的 每 一 个 顶点 。 这 个 
问题 称 为 哈密 尔 顿 圈 问 题 (Hamiltonian cycle problem) 。 虽 然 看 起 来 这 个 问题 似乎 差不多 和 欧 
拉 回 路 问题 一 样 ， 但 是 ， 对 它 却 没有 已 知 的 有 效 算法 。 我 们 将 在 9. 7 节 中 再 次 看 到 这 个 问题 。 


9. 6.4 有 向 图 


利用 与 无 向 图 相同 的 思路 ， 也 可 以 通过 深度 优先 搜索 以 线性 时 间 遍 历 有 向 图 。 如 果 图 
不 是 强 连通 的 ， 那 么 从 某 个 节点 开始 的 深度 优先 搜索 可 能 访问 不 了 所 有 的 节点 。 在 这 种 情 
况 下 我 们 在 某 个 未 作 标记 的 节点 处 开始 ， 反 复 执行 深度 优先 搜索 ， 直 到 所 有 的 节点 都 被 访 
问 到 。 作 为 例子 ， 考虑 图 9-74 中 的 有 向 图 。 








图 9-74 一 个 有 向 图 


我 们 在 顶点 B 任意 开始 深度 优先 搜索 。 它 访问 顶点 B，C，A，D，E，F。 然 后 ， 在 某 
个 未 访问 的 顶点 再 重新 开始 。 我 们 任意 地 在 H FR, DIA). 最 后 ,在 G 点 开始 ， 它 
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是 最 后 一 个 需要 访问 的 顶点 。 对 应 的 深度 优先 搜索 树 如 图 9-75 所 示 。 





图 9-75 前面 的 图 的 深度 优先 搜索 


在 深度 优先 生成 森林 中 ， 虚 线 箭 头 是 一 些 (v, w) 边 ， 其 中 的 ww 在 考察 时 已 经 作 了 标 
记 。 在 无 向 图 中 ， 总 有 一 些 背 向 边 ,， 但 是 我 们 可 以 看 到 ,存在 三 种 类 型 的 边 并 不 通 向 新 的 
顶点 。 首 先是 一 些 背 向 边 ， 如 (A, BAC, HO, iA — +E Ai i] 32 (forward edge), Acc. 
D) 和 (C, EEF)， 它 们 从 树 的 一 个 节点 通 疝 一 个 后 衣 。 最 后 就 是 一 些 交 叉 边 ， 如 (Ff, OMG, 
F), 它们 把 不 直接 相关 的 两 个 树 节 点 连接 起 来 。 深 度 优先 搜索 森林 一 般 通过 把 一 些 子 节点 
和 一 些 新 的 树 从 左 到 右 添加 到 森林 中 形成 。 在 以 这 种 方式 构成 的 有 向 图 的 深度 优先 搜索 中 ， 
交叉 边 总 是 从 左 到 右 行进 的 。 

有 些 使 用 深度 优先 搜索 的 算法 需要 区 别 非 树 边 的 三 种 类 型 。 当 进行 深度 优先 搜索 时 这 
是 容易 检验 的 ， 我 们 把 它 留 作 一 道 练习 。 

深度 优先 搜索 的 一 种 用 途 是 检测 一 个 有 向 图 是 否 是 无 圈 图 ， 法则 如 下 : 一 个 有 向 图 是 
无 圈 图 当 且 仪 当 它 没有 缘 向 边 。( 上 面 的 图 有 背 向 边 ， 因 此 它 不 是 无 圈 图 ,) 读 者 可 能 还 记 
得 ， 拓 扑 排序 也 可 以 用 来 确定 一 个 图 是 否 是 无 圈 图 。 进 行 拓扑 排序 的 另 一 种 方法 是 通过 深 
度 优先 生成 森林 的 后 序 遍 历 给 顶点 指定 拓扑 编号 N，N 一 1, e. 1。 只 要 图 是 无 圈 的 ， 这 种 
排序 就 是 一 致 的 。 


9.6.5 查找 强 分 支 


通过 执行 两 次 深度 优先 搜索 ,我 们 可 以 检测 一 个 有 向 图 是 否 是 强 连通 的 ， 如 果 它 不 是 
强 连 通 的 ,那么 我 们 实际 上 可 以 得 到 顶点 的 一 些 子 集 ， 它 们 到 其 自身 是 强 连通 的 。 这 也 可 
以 只 用 一 次 深度 优先 搜索 做 到 ， 不 过 ， 此 处 所 使 用 的 方法 理解 起 来 要 简单 得 多 。 

首先 ， 在 一 个 输入 的 图 G 上 执行 一 次 深度 优先 搜索 。 通 过 对 深度 优先 生成 森林 的 后 序 
遍历 将 G 的 顶点 编号 ， 然 后 再 把 G 的 所 有 的 边 反 向 ， 形 成 G,。 图 9-76 代表 图 9-74 所 示 的 
图 G 的 G,， 顶 点 用 它们 的 编号 表示 。 

该 算法 通过 对 G, 执 行 一 次 深度 优先 搜索 而 完成 ， 总 是 在 编号 最 高 的 顶点 开始 一 次 新 的 
深度 优先 搜索 。 于 是 ， 我 们 在 顶点 G 开始 对 G, 的 深度 优先 搜索 ，G 的 编号 为 10。 但 该 顶点 
不 通 向 任何 顶点 ， 因 此 下 一 次 搜索 在 瓦 点 开始 。 这 次 调用 访问 工种 J 。 下 一 次 调用 在 B 点 
开始 并 访问 A、C 和 下 。 此 后 的 调用 是 Dfs(D) 及 最 终 调 用 Dfs(E)。 结 果 得 到 的 深度 优先 
生成 森林 如 图 9-77 所 示 。 
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A 9-77 G, 的 深度 优先 搜索 一 一 强 分 支 为 {G},， (H, 1, J}, (B, A, C, F}, {D}, (E) 


在 该 深度 优先 生成 森林 中 的 每 棵 树 ( 如 果 完 全 忽略 所 有 的 非 树 边 ， 那 么 这 是 很 容易 看 出 
的 ) 形 成 一 个 强 连通 的 分 支 。 因 此 ， 对 于 我 们 的 例子 ， 这 些 强 连通 分 支 为 {G},，{H,， I, J}, 
(Bs Ay C, FF, QD Eja 

为 了 理解 该 算法 为 什么 成 立 ， 首 先 注意 到 ， 如 果 两 个 顶点 v 和 w 都 在 同一 个 强 连 通 分 
Xp. ABA ERE G 中 就 存在 从 wv 到 w 的 路 径 和 从 w 到 ww 的 路 径 ， 因此， 在 G, 中 也 存在 。 


现在 ， 如 果 两 个 顶点 wv 和 w 不 在 G, 的 同一 个 深度 优先 生成 树 中 ， 那 么 显然 它们 也 不 可 能 在 
同一 个 强 连通 分 支 中 。 
为 了 证 明 该 算法 成 立 ， 我 们 必须 指出 ， 如 果 两 个 顶点 v 和 ww 在 G, 的 同一 个 深度 优先 生 


成 树 中 ， 那 么 必然 存在 从 v Sl ww 的 路 径 和 从 w 到 w 的 路 径 。 等 价 地 ， 我 们 可 以 证 明 ， 如 果 
EGBA v 的 深度 优先 生成 树 的 根 ， 那 么 存在 一 条 从 工 到 v MA v S] x BUTS. XE ow IW 
用 相同 的 推理 则 得 到 一 条 从 zx 到 w 和 从 w 到 x 的 路 径 。 这 些 路 径 则 意味 着 那些 从 v 到 w 和 
MK sw Sl v CERE 30 BER AE. 

由 于 v 是 xz 在 G, 的 深度 优先 生成 树 中 的 一 个 后 裔 ， 因 此 存在 G, 中 一 条 从 xz 到 w 的 路 
径 ， 从 而 存在 G 中 一 条 从 wv Bla 的 路 径 。 此 外 ， 由 于 工 是 根 节点 ， 因 此 r 从 第 一 次 深度 优 
先 搜索 得 到 更 高 的 后 序 编号 。 于 是 ， 在 第 一 次 深度 优先 搜索 期 间 所 有 处 理 v 的 工作 都 在 x 
的 工作 结束 前 完成 。 既 然 存在 一 条 从 v 到 xz 的 路 径 ， 因 此 vv 必然 是 x 在 G 的 生成 树 中 的 一 
个 后 毅 一 一 否则 o 将 在 xz 之 后 结束 。 这 意味 着 G 中 从 x 到 v 有 一 条 路 径 ， 证明 完成 。 
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数据 结构 与 算法 分 析 C 语言 描述 


9.7. NP- 完 全 性 介绍 


在 这 一 章 , 我 们 已 经 看 到 各 种 各 样 图 论 问题 的 解法 。 所 有 这 些 问题 都 有 一 个 多 项 式 运行 
时 间 ， 除 网 络 流 问题 外 ， 运 行 时 间或 者 是 线性 的 ,或 者 稍微 比 线性 多 一 些 (O( | E|log|E|))。 
顺便 指出 ， 我 们 还 提 到 ， 对 于 某 些 问题 ,有些 变 化 似乎 比 原始 问题 要 困难 。 

回忆 欧 拉 回路 问题 ， 它 要 求 找 出 一 条 路 径 恰好 每 条 边 经 过 一 次 ,该 问题 是 线性 时 间 可 
解 的 。 哈 密 尔 顿 圈 问 题 要 找 一 个 简单 圈 ， 该 圈 包 含 每 一 个 顶点 。 对 于 这 个 问题 ， 尚 不 知道 
有 线性 算法 。 

对 于 有 向 图 的 单 发 点 无 权 最 短路 径 问 题 也 是 线性 时 间 可 解 的 。 但 对 应 的 最 长 简单 路 径 
问题 (longest-simple-path) 尚 不 知 有 线性 时 间 算 法 。 

这 些 问 题 的 变化 ， 其 情况 实际 上 比 我 们 描述 的 还 要 糟 。 对 于 这 些 变种 问题 不 仅 不 知道 
线性 算法 ， 而 且 不 存在 保证 以 多 项 式 时 间 运 行 的 已 知 算法 。 这 些 问题 的 一 些 熟 知 算法 对 于 
某 些 输入 可 能 要 花费 指数 时 间 。 

在 这 一 节 ， 我 们 将 简要 考察 这 种 问题 。 这 种 问题 是 相当 复杂 的 ， 因 此 我 们 将 只 进行 快 
速 和 非 正式 的 探讨 。 这 样 一 来 ,我 们 的 讨论 可 能 (必然 地 ) 处 处 都 或 多 或 少 有 些 不 准确 的 
缺憾 。 

我 们 将 看 到 ， 存 在 大 量 重要 的 问题 ， 它 们 在 复杂 性 上 大 体 是 等 价 的 。 这 些 问 题 形 成 一 
个 类 ， 叫 作 NP- 完 全 (NP-complete) 问 题 。 这 些 NP- 完 全 问题 精确 的 复杂 度 仍 然 需 要 确定 并 
且 在 计算 机 理论 科学 方面 仍然 是 最 重要 的 开放 性 问题 。 或 者 所 有 这 些 问题 有 多 项 式 时 间 解 
法 ， 或 者 它们 都 没有 多 项 式 时 间 解 法 。 


9.7.1 难 与 易 


在 给 问题 分 类 时 ， 第 一 步 要 考虑 的 是 分 界 。 我 们 已 经 看 到 ， 许 多 问题 可 以 用 线性 时 间 
求解 。 我 们 还 看 到 某 些 O(log N) 的 运行 时 间 ， 但 是 它们 或 者 假定 已 作 某 些 预 处 理 ( 如 输入 
数据 已 读 和 或 数据 结构 已 建立 ), 或 者 出 现在 运算 实例 中 。 例 如 ，Gca( 最 高 公 因 数 ) 算 法 ， 
当 用 于 两 个 数 M 和 NN 时 ,花费 O(log N) 时 间 。 由 于 这 两 个 数 分 别 由 log M 和 log N 个 二 
进 制 位 组 成 ， 因 此 God 算法 实际 上 花费 的 时 间 对 于 输入 数据 的 量 或 大 小 而 言 是 线性 的 。 由 
此 可 知 ， 当 度量 运行 时 间 时 ， 我 们 将 把 运行 时 间 考 虑 成 输入 数据 的 量 的 函数 。 一 般 说 来 ， 
我 们 不 能 期 望 运行 时 间 比 线性 更 好 。 

另 一 方面 ， 确 实 存在 某 些 真正 难 的 问题 。 这 些 问 题 是 如 此 的 难 ， 以 至 于 它们 不 可 能 解 
出 。 但 这 并 不 意味 着 通常 那 种 愧 恼 叹 息 ， 叹 息 意 味 着 求解 该 问题 需要 天 才 。 正 如 实数 不 足 
以 表示 x 二 0 的 解 那样 ， 可 以 证 明 ， 计算 机 不 可 能 解决 碰巧 发 生 的 每 一 个 问题 。 这 些 “ 不 
可 能 ” 解 出 的 问题 叫 作 不 可 判定 问题 Cundecidable problem), 

一 个 特殊 的 不 可 判定 问题 是 停机 问题 (halting problem)。 是 否 能 够 让 你 的 C 编译 器 拥 
有 一 个 附加 的 特性 ， 即 不 仅 能 够 检查 语法 错误 ， 而 且 还 能 够 检查 所 有 的 无 限 循环 ? 这 似乎 
是 一 个 难 的 问题 ， 但 是 我 们 或 许 期 望 ， 假 如 某 些 非常 聪明 的 程序 员 花 上 足够 的 时 间 ， 他 们 


也 许 能 够 编制 出 这 种 增强 型 的 编译 器 。 

该 问题 是 不 可 判定 的 ， 其 直观 原因 在 于 这 样 一 个 程序 可 能 很 难 检查 它 自己 。 由 于 这 个 
原因 ， 有 时 这 些 问题 叫 作 递归 不 可 判定 的 (recursively undecidable) , 

如 果 一 个 无 限 循环 检查 程序 能 够 写 出 ， 那 么 它 肯定 可 以 用 于 自 检 。 此 时 我 们 可 以 得 到 
一 个 程序 叫 作 LOOP. Loop 把 一 个 程序 P 作为 输入 并 使 P 自身 运行 。 如 果 P 自身 运行 时 出 
现 循环 ， 则 显示 短语 YES. WR P 自身 运行 时 终止 了 ,那么 自然 要 做 的 事 是 显示 No. (RE 
这 么 做 的 办 法 是 ,我们 将 让 Loop 进入 一 个 无 限 循环 。 

当 LOOP 将 自身 作为 输入 时 会 发 生 什 么 呢 ? 或 者 LOOP 停止 ,或 者 不 停止 。 问 题 在 于 ， 
这 两 种 可 能 性 均 导致 耶 盾 ， 与 短语 “这 句 话 是 一 名 谎言 ”产生 的 矛盾 大 致 相同 。 

根据 我 们 的 定义 ， 如 果 PPIE, M LooP(CP) 进 入 一 个 无 限 循环 。 设 当 P— Loop 
时 ，P(P) 终 止 。 此 时 ， 按照 Loop 程序 ，LOoP(P) 应 该 进入 一 个 无 限 循环 。 因 此 ， 我 们 必 
Alii: LOOP (LOOP) 终 止 并 进入 一 个 无 限 循环 ， 显 然 这 是 不 可 能 的 。 另 一 方面 ， 设 当 P= 
LOOP 时 P(P) 进 入 一 个 无 限 循 环 ， 则 LooOP(P) 必 须 终止 ， 而 我 们 得 到 同样 的 一 组 矛盾 。 因 
Ik. 我们 看 到 ， 程序 Loop 不 可 能 存在 。 


9.7.2 NP 类 


NP 类 是 在 难度 上 逊 于 不 可 判定 问题 的 类 。NP 代表 非 确定 型 多 项 式 时 间 (nondetermin- 
istic polynomial-time) 。 确 定型 机 器 在 每 一 时 刻 都 在 执行 一 条 指令 。 根 据 这 条 指令 ， 机 器 再 
去 执行 某 条 接 下 来 的 指令 ， 这 是 唯一 确定 的 。 而 一 台 非 确定 型 机 器 对 其 后 的 步骤 是 有 选择 
的 。 它 可 以 自由 进行 它 想 要 的 任意 的 选择 ， 如 果 这 些 后 面 的 步骤 中 有 一 条 导致 问题 的 解 ， 
那么 它 将 总 是 选择 这 个 正确 的 步 又。 因此 ， 非 确定 型 机 器 具有 非常 好 的 猜测 (优化 ) 能 力 。 
这 好 像 一 台 奇 怪 的 模型 ， 因 为 没有 人 能 够 构建 一 台 非 确定 型 计算 机 ， 还 因为 这 人 台 机 器 是 对 
标准 计算 机 的 令 人 难以 置信 的 改进 (此 时 每 一 个 问题 都 变 成 易 解 的 了 )。 我 们 将 看 到 ， 非 确 
定性 是 非常 有 用 的 理论 结构 。 此 外 ， 非 确定 性 也 不 像 人 们 想象 的 那么 强大 。 例 如 ， 即 使 使 
用 非 确定 性 ， 不 可 判定 问题 仍然 还 是 不 可 判定 的 。 

检验 一 个 问题 是 否 属于 NP 的 简单 方法 是 将 该 问题 用 是 / 否 (yes/no) 问 题 的 语言 描述 。 
如 果 我 们 在 多 项 式 时 间 内 能 够 证 明 一 个 问题 的 任意 “是 ”的 实例 是 正确 的 ， 那么 该 问题 属 
T NP 类。 我们 不 必 担 心 “ 否 ”的 实例 ， 因 为 程序 总 是 进行 正确 的 选择 。 因 此 ， 对 于 哈密 
尔 顿 圈 问 题 ， 一 个 “是 ”的 实例 就 是 图 中 任意 一 个 包含 所 有 顶点 的 简单 的 回路 。 由 于 给 定 
一 条 路 径 ， 验 证 它 是 否 真 的 是 哈密 尔 顿 圈 是 一 件 简单 的 事情 ， 因 此 哈密 尔 顿 圈 问 题 属 于 
NP, if "fric E> K 的 简单 路 径 吗 ?” 这 样 的 适当 的 问题 也 可 能 容易 验证 从 而 属于 
NP。 满 足 这 条 性 质 的 任何 路 径 均 可 容易 地 检验 。 

由 于 解 本 身 显然 提供 了 验证 方法 ， 因 此 ，NP 类 包括 所 有 具有 多 项 式 时 间 解 的 问题 。 人 
们 会 想到 ， 既 然 验 证 一 个 答案 要 比 经 过 计算 提出 一 个 答案 容易 得 多 ， 因 此 在 NP 中 就 会 存 
在 不 具有 多 项 式 时 间 解 法 的 问题 。 这 样 的 问题 至 今 没 有 发 现 ， 于 是 ， 完 全 有 可 能 非 确 定性 
并 不 是 如 此 重要 的 改进 ， 尽 管 有 些 专家 很 可 能 不 这 么 认为 。 问 题 在 于 , 证明 指 数 下 界 是 一 
项 极其 困难 的 工作 。 我 们 曾 用 来 证 明 排 序 需 要 Q(N log N) 次 比较 的 信息 理论 定 界 方法 似乎 
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还 不 足以 完成 这 样 的 工作 ， 因 为 决策 树 都 还 不 够 大 。 

还 要 注意 ,不 是 所 有 的 可 判定 问题 都 属于 NP。 考 虑 确定 一 个 图 是 否 没有 哈密 尔 顿 圈 的 
问题 。 证 明 一 个 图 有 哈密 尔 顿 轿 是 相对 简单 的 一 件 事情 一 一 我 们 只 需 展示 一 个 即 可 。 然 而 
却 没 有 人 知道 如 何以 多 项 式 时 间 证 明 一 个 图 没有 哈密 尔 顿 轿 。 似 乎 人 们 只 能 枚 举 所 有 的 圈 
并 且 将 它们 一 个 一 个 地 验证 才 行 。 因 此 ， 无 哈密 尔 顿 圈 的 问题 不 知 属于 不 属于 NP. 


9.7.3 NP- 完 全 问题 


在 已 知 属于 NP 的 所 有 问题 中 ， 存 在 一 个 子 集 ， 叫 作 NP- 完 全 (NP-complete) 问 题 ， 它 
包含 了 NP 中 最 难 的 问题 。NP- 完 全 问题 有 一 个 性 质 ， 即 NP 中 的 任意 问题 都 能 够 多 项 式 地 
归 约 成 NP- 完 全 问题 。 

一 个 问题 已 可 以 如 下 归 约 成 问题 Pl 设 有 一 个 映射 ， 使 得 已 的 任何 实例 都 可 以 变换 
成 P: 的 一 个 实例 。 求 解 Pl. ， 然 后 将 答案 映射 回 原始 的 解答 。 作 为 一 个 例子 ， 考 虑 把 数 以 十 
进 制 输入 到 一 只 计算 器 。 将 这 些 十 进 制 数 转化 成 二 进 制 数 ， 所 有 的 计算 都 用 二 进 制 进行 。 
然后 ， 再 把 最 后 答案 转变 成 十 进 制 显示 。 对 于 可 多 项 式 地 归 约 成 PLAY 已 ， 与 变换 相 联 系 的 
所 有 的 工作 必然 以 多 项 式 时 间 完 成 。 

NP- 完 全 问题 是 最 难 的 NP 问题 的 原因 在 于 ， 一 个 NP- 完 全 的 问题 基本 上 可 以 用 作 NP 
中 任何 问题 的 子 程序 ， 其 花费 只 不 过 是 多 项 式 的 开销 量 。 因 此 ， 如 果 任 意 NP- 完 全 问题 有 
一 个 多 项 式 时 间 解 ， 那 么 NP 中 的 每 一 个 问题 必然 都 有 一 个 多 项 式 时 间 的 解 。 这 使 得 NP- 完 
全 问题 是 所 有 NP 问题 中 最 难 的 问题 。 

设 我 们 有 一 个 NP- 完 全 问题 P| ， 并 设 PERET NP。 再 进一步 假设 Pi 多 项 式 地 归 约 
成 P, ， 使 得 我 们 可 以 通过 使 用 已 求解 已 只 多 损耗 了 多 项 式 时 间 。 由 于 已 是 NP- 完 全 的 ， 
NP 中 的 每 一 个 问题 都 可 多 项 式 地 归 约 成 Pl! 。 应 用 多 项 式 的 封闭 性 ， 我 们 看 到 ，NP 中 的 每 
一 个 问题 均 可 多 项 式 地 归 约 成 P. : 我 们 把 问题 归 约 成 P|， 然 后 再 把 Pi 归 约 成 P,。 因 此 ， 
P, 是 NP- 完 全 的 。 

作为 一 个 例子 ， 设 我 们 已 经 知道 哈密 尔 顿 圈 问 题 是 NP- 完 全 问题 。 巡 回 售 货 员 (trave- 
ling salesman problem) 问 题 如 下 。 


巡回 售货员 问题 

给 定 一 完全 图 G 二 (V，E)、 它 的 边 的 值 以 及 整数 K， 是 否 存在 一 个 访问 所 有 顶点 并 且 
MEK 的 简单 圈 ? 

这 个 问题 不 同 于 哈密 尔 顿 圈 问 题 ， 因 为 全 部 |V|1(IV| 一 1)/2 条 边 都 存在 而 且 图 是 赋 权 
图 。 该 问题 有 很 多 重要 的 应 用 。 例 如 ， 印 刷 电路 板 需要 穿 一 些 孔 使 得 芯片 、 电 阻 器 以 及 其 
他 的 电子 元 件 可 以 置信。 这 是 可 以 机 械 完成 的 。 穿 孔 是 快速 的 操作 ， 时 间 耗 费 在 给 穿孔 器 
定位 上 。 定 位 所 需要 的 时 间 依 赖 于 从 孔 到 孔 间 行进 的 距离 。 由 于 我 们 希望 给 每 一 个 孔 位 穿 
孔 ( 然 后 返回 到 开始 位 置 以 便 给 下 一 块 电路 板 穿 孔 )， 并 将 钻头 移动 所 耗费 的 总 时 间 限 制 到 
最 小 ， 因 此 我 们 得 到 的 是 一 个 巡回 售货员 问题 。 

巡回 售货员 问题 是 NP- 完 全 的 。 容 易 看 到 ， 其 解 可 以 用 多 项 式 时 间 检 验 ， 当 然 它 属于 


NP。 为 了 证 明 它 是 NP- 完 全 的 ， 我 们 可 多 项 式 地 将 哈密 尔 顿 圈 问 题 归 约 为 巡回 售货员 问 
题 。 为 此 ， 构 造 一 个 新 的 图 G ，G 和 G 有 相同 的 顶点 。 对 于 G 的 每 一 条 边 (v, w), WR o, 
w) EG， 那 么 它 就 有 权 1， 和 否则 ， 它 的 权 就 是 2。 我 们 选取 K=|V|. WA 9-78。 


(Vi) (v1) 
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图 9-78 哈密 尔 顿 圈 问 题 变换 成 巡回 售货员 问题 


容易 验证 ，G 有 一 个 哈密 尔 顿 圈 当 上 且 仅 当 G' 有 一 个 总 权 为 |V | 的 巡回 售货员 的 巡回 
路 线 。 

现在 有 许多 已 知 是 NP- 完 全 的 问题 。 为 了 证 明 某 个 新 问题 是 NP- 完 全 的 ， 必 须 证 明 它 
属于 NP， 然后 将 一 个 适当 的 NP- 完 全 问题 变换 到 该 问题 。 虽 然 到 巡回 售货员 问题 的 变换 是 
相当 简单 的 , 但 是 ， 大 部 分 变换 实际 上 却 是 相当 复杂 的 ， 需 要 某 些 复杂 的 构造 。 一 般 说 ， 
在 考虑 了 多 个 不 同 的 NP- 完 全 问题 之 后 才 考 虑 实际 提供 归 约 化 的 问题 。 由 于 我 们 只 关注 一 
般 的 想法 ， 因 此 也 就 不 再 讨论 更 多 的 变换 ; 有 兴趣 的 读者 可 以 查阅 本 章 后 面 的 参考 文献 。 

细心 的 读者 可 能 想 知道 第 一 个 NP- 完 全 问题 是 如 何 具体 地 被 证 明 是 NP- 完 全 的 。 由 于 
证 明 一 个 问题 是 NP- 完 全 的 需要 从 另外 一 个 NP- 完 全 问题 变换 到 它 ， 因 此 必然 存在 某 个 NP- 
完全 问题 ， 对 于 这 个 问题 上 述 思路 行 不 通 。 第 一 个 被 证 明 是 NP- 完 全 的 问题 是 可 满足 性 
(satisfiability) 问 题 。 这 个 可 满足 性 问题 把 一 个 布尔 表达 式 作 为 输入 并 提问 是 否 该 表达 式 对 
式 中 各 变量 的 一 次 赋值 取 值 1。 

可 满足 性 当然 属于 NP， 因 为 容易 计算 一 个 布尔 表达 式 的 值 并 检查 结果 是 否 为 真 
(true), Æ 1971 Æ, Cook 通过 直接 证 明 NP 中 的 所 有 问题 都 可 以 变换 成 可 满足 性 问题 而 证 
明了 可 满足 性 问题 是 NP- 完 全 的 。 为 此 ， 他 用 到 了 对 NP 中 每 一 个 问题 都 已 知 的 事实 : NP 
中 的 每 一 个 问题 都 可 以 用 一 台 非 确定 型 计算 机 在 多 项 式 时 间 内 求解 。 计 算 机 的 一 个 形式 化 
的 模型 称 作 图 灵机 (Turing machine), Cook 指出 这 台 机 器 的 动作 如 何 能 够 用 一 个 极其 复杂 
但 仍然 是 多 项 式 的 宛 长 的 布尔 公式 来 模拟 。 该 布尔 公式 为 真 ， 当 且 仅 当 在 由 图 灵机 和 运行 的 
程序 对 其 输入 得 到 一 个 “是 ”的 答案 。 

一 旦 可 满足 性 被 证 明 是 NP- 完 全 的 ， 则 一 大 批 新 的 NP- 完 全 问题 (包括 某 些 最 经 典 的 问 
题 ) 也 都 被 证 明 是 NP- 完 全 的 。 

除 可 满足 性 问题 外 ， 我 们 已 经 考察 过 的 哈密 尔 顿 回路 问题 、 巡 回 售货员 问题 、 最 长 路 
径 问 题 都 是 NP- 完 全 问题 ， 此 外 ， 还 有 一 些 我 们 尚未 讨论 的 问题 如 装 箱 (bin packing) 问 题 、 
背包 (knapsack) 问 题 、 图 的 着 色 (graph coloring) 问 题 以 及 团 (clique) 的 问题 都 是 著名 的 NP- 
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完全 问题 。NP- 完 全 问题 相当 广泛 ， 包 括 来 自 操作 系统 (调度 和 安全 )、 数 据 库 系统 、 运 筹 
学 、 逻 辑 学 、 特 别 是 图 论 等 不 同 的 领域 的 问题 。 


@ 总 结 
在 这 一 章 ， 我 们 已 经 看 到 图 如 何 用 来 对 许多 实际 生活 问题 给 出 模型 。 实 际 出 现 的 图 党 
常 是 非常 稀疏 的 ， 因 此 ， 注 意 用 于 实现 这 些 图 的 数据 结构 很 重要 。 
我 们 还 看 到 一 类 问题 ， 它 们 似乎 没有 有 效 的 解法 。 在 第 10 章 将 讨论 处 理 这 些 问题 的 某 
些 方法 。 


Q 练习 
9.1 RER 9-79 的 一 个 拓扑 排序 。 











B] 9-79 


9.2 ”如 果 用 一 个 栈 代替 9. 1 节 中 拓扑 排序 算法 的 队列 ， 是 否 得 到 不 同 的 排序 ? 为 什么 一 种 
数据 结构 会 给 出 “更 好 ”的 答案 ? 

9.3 编写 一 个 程序 执行 对 一 个 图 的 拓扑 排序 。 

9.4 使 用 标准 的 二 重 循环 ， 一 个 邻接 矩阵 仅仅 初始 化 就 需要 O( 1V 1 )。 试 提出 一 种 方法 将 
一 个 图 存储 在 一 个 邻接 矩阵 中 (使 得 测试 一 条 边 是 否 存在 花费 O(1)) 但 避免 二 次 的 运 
行 时 间 。 

9.5 a. 找 出 图 9-80 A 点 到 所 有 其 他 顶点 的 最 短路 径 。 

b. 找 出 图 9-80 中 B 点 到 所 有 其 他 顶点 的 最 短 无 权 路 径 。 
1 


B 














9.6 “Aid - 堆 实 现时 (6. 5 43), Dijkstra 算法 最 坏 情形 的 运行 时 间 是 多 少 ? 
9.7 a. 给 出 在 有 一 条 负 边 但 无 负 值 圈 时 Dijkstra 算法 得 到 错误 答案 的 例子 。 
xxb. 证 明 ， 如 果 存 在 负 权 边 但 无 负 值 图 ， 则 9. 3. 3 节 中 提出 的 赋 权 最 短路 径 算法 是 成 立 
的 ， 并 证 明 该 算法 的 运行 时 间 为 O(|E| . |V|)。 
«9.8 设 一 个 图 的 所 有 边 的 权 都 是 在 1 和 | 已 | 之 间 的 整数 。Dijkstra 算法 可 以 多 快 实现 ? 
9.9 ” 写 出 一 个 程序 来 求解 单 发 点 最 短路 径 问 题 。 
9.10 a. 解释 如 何 修改 Dijkstra 算法 以 得 到 从 v 到 w 的 不 同 的 最 小 路 径 的 个 数 的 计数 。 " 
b. 解释 如 何 修改 Dijkstra 算法 使 得 如 果 存 在 多 于 一 条 从 v 到 w 的 最 小 路 径 ， 那 么 具 UT 
有 最 少 边 数 的 路 径 将 被 选中 。 338, 
9.11 找 出 图 9-79 中 的 网 络 的 最 大 流 。 
9.12 设 G=(V, E) 是 一 棵 树 ，s 是 它 的 根 ， 并 且 添 加 一 个 顶点 上 以 及 从 G 中 所 有 树叶 到 1 
的 无 穷 容量 的 边 。 给 出 一 个 线性 时 间 算 法 以 找 出 从 * 到 1 的 最 大 流 。 
9. 13 ”一 个 二 分 图 G=(V，E) 是 把 V 划分 成 两 个 子 集 V1 和 Vs 并 且 其 边 的 两 个 顶点 都 不 在 
同一 个 子 集中 的 图 。 
a. 给 出 一 个 线性 算法 以 确定 一 个 图 是 否 是 二 分 图 。 
b. 二 分 匹配 间 题 是 找 出 5 的 最 大 子 集 E' 使 
得 没有 顶点 含 在 多 于 一 条 的 边 中 。 
9-81 中 所 示 的 是 四 条 边 的 一 个 匹配 
' (由 虚线 表示 )。 存 在 一 个 五 条 边 的 匹 
配 ， 它 是 最 大 的 匹配 。 
指出 二 分 匹配 间 题 如 何 能 够 用 于 解决 下 
列 问题 ， 有 一 组 教师 、 一 组 课程 ， 以 及 
每 位 教师 有 资格 教授 的 课程 表 。 如 果 没 图 9-81 一 个 二 分 图 
有 教师 需要 教授 多 于 一 门 的 课程 ， 而 且 只 有 一 位 教师 可 以 教授 一 门 给 定 的 课程 ， 
那么 可 以 提供 开设 的 课程 的 最 大 门 数 是 多 少 ? 
c. 证 明 网 络 流 问 题 可 以 用 来 解决 二 分 匹配 问题 。 
d. 对 问题 (b) ， 你 的 解法 的 时 间 复 杂 度 如 何 ? 
9.14. 给 出 一 个 算法 找 出 容许 最 大 流通 过 的 增长 通路 。 
9.15 a. 使 用 Prim 和 Kruskal 两 种 算法 求 出 图 9-82 中 的 最 小 生成 树 。 
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b. 这 棵 最 小 生成 树 是 唯一 的 吗 ? 为 什么 ? 








9.16 如果 有 一 些 负 的 边 权 ， 那 么 Prim 算法 或 Kruskal 算法 还 能 行 得 通 吗 ? 
9.17 证明 V 个 顶点 的 图 可 以 有 V" 棵 最 小 生成 树 。 
9.18 ”编写 一 个 程序 实现 Kruskal 算法 。 
9.19 如 果 一 个 图 的 所 有 边 的 权 都 在 1 和 | 五 | 之 间 ， 那 么 能 有 多 快 算 出 最 小 生成 树 ? 
9.20 给 出 一 个 算法 求解 最 大 生成 树 。 这 上 比 求 解 最 小 生成 树 更 难 吗 ? 
9.21 求 出 图 9-83 中 的 所 有 的 割 点 。 指 出 深度 优先 生成 树 和 每 个 顶点 的 Num 和 Low 的 值 。 
i Te 
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证 明 寻 找 割 点 的 算法 的 正确 性 。 
9.23 a. 给 出 一 种 算法 ， 求 出 需要 从 一 个 无 向 图 中 删除 后 使 所 得 的 图 是 无 圈 图 的 最 小 的 边 数 。 
xb. 证 明 这 个 问题 对 有 向 图 是 NP- 完 全 的 。 

9.24 证 明 ， 在 一 个 有 向 图 的 深度 优先 生成 森林 中 所 有 的 交叉 边 都 是 从 右 到 左 的 。 

9.25 给 出 一 个 算法 以 决定 在 一 个 有 向 图 的 深度 优先 生成 森林 中 的 一 条 边 (v，w) 是 否 是 

树 、 背 向 边 、 交 叉 边 或 前 向 边 。 

找 出 图 9-84 中 的 强 连 通 分 支 。 

编写 一 个 程序 以 找 出 一 个 有 向 图 的 强 连 通 

2 3 s 

x9.28 给 出 一 个 算法 ， 在 只 有 一 次 深度 优先 搜索 内 
找 出 强 连 通 分 支 来 。 使 用 类 似 于 双 连 通 性 算 
法 的 算法 。 

9.29 一 个 图 G 的 双 连 通 分 支 (biconnected compo- 
nent) 是 把 边 分 成 一 些 集合 的 划分 ， 使 得 每 个 
边 集 所 形成 的 图 是 双 连 通 的 。 修 改 图 9-67 中 的 算法 使 其 能 找 出 双 连 通 分 支 而 不 是 
割 点 。 

9.30 设 我 们 对 一 个 无 向 图 进行 广度 优先 搜索 并 建立 一 棵 广度 优先 生成 树 。 证 明 该 树 所 有 
的 边 或 者 是 树 边 或 者 是 交叉 边 。 

9.31 给 出 一 个 算法 以 在 一 个 无 向 (连通 ) 图 中 找 出 一 条 路 径 使 其 在 每 个 方向 上 通过 每 条 边 

恰好 一 次 。 
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.36 多 重 图 (multigraph) 是 在 其 内 的 顶点 对 之 
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. 32 a. 编写 一 个 程序 以 找 出 一 个 图 中 的 一 条 欧 拉 回路 (如 果 存 在 的 话 )。 


b. 编写 一 个 程序 以 找 出 一 个 图 中 的 一 条 欧 拉 环 游 (如 果 存 在 的 话 ) 。 


.33 有 向 图 中 的 欧 拉 回路 是 一 个 圈 ， 该 圈 中 的 每 条 边 恰 好 被 访问 一 次 。 


xa. 证 明 ， 有 向 图 有 欧 拉 回路 当 且 仅 当 它 是 强 连通 的 并 且 每 个 顶点 的 人 度 等 于 出 度 。 
xb. 给 出 一 个 算法 以 在 存在 欧 拉 回路 的 有 向 图 中 找 出 一 条 欧 拉 回路 。 


.34 a 考虑 欧 拉 回路 问题 的 下 列 解法 : 假设 一 个 图 是 双 连 通 的 。 执 行 一 次 深度 优先 搜索 ， 


只 在 万 不 得 已 的 时 候 使 用 背 向 边 。 如 果 图 不 是 双 连 通 的 ， 则 对 双 连 通 分 支 递 归 地 
应 用 该 算法 。 这 个 算法 行 得 通 吗 ? 

b. 设 当 用 到 背 向 边 时 我 们 取 用 连接 到 最 近 祖 先 节点 的 背 向 边 ， 那 么 该 算法 是 否 行 
得 通 ? 


.35 PHR (planar graph) 是 一 个 可 以 画 在 一 个 平面 上 而 其 任何 两 条 边 都 不 相交 的 图 。 


*a. 证 明 图 9-85 中 的 两 个 图 都 不 是 平面 图 。 
b. 证 明 ， 在 平面 图 中 必然 存在 某 个 顶点 
与 最 多 不 超过 五 个 顶点 相连 。 
*«c. 证 明 在 平面 图 中 |E|<3|V| 一 6。 


间 可 以 有 多 重 边 (multiple edge) 的 图 。 本 
章 中 哪些 算法 对 于 多 重 图 不 用 修改 就 能 
正确 运行 ? 对 其 余 的 算法 需要 进行 哪些 图 9-85 
修改 ? 

37 4G-(V, E) 是 一 个 无 向 图 。 使 用 深度 优先 搜索 设计 一 个 线性 算法 把 G 的 每 条 边 转 
换 成 有 向 边 使 得 所 得 到 的 图 是 强 连 通 的 ， 或 者 确定 这 是 不 可 能 的 。 





.38 给 你 一 套 棍 ( 共 六 根 )， 它 们 以 某 种 结构 相互 登 压 平 放 。 每 根 棍 由 它 的 两 端点 确定 ; 


每 个 端点 是 由 x、y 和 x 坐标 确定 的 有 序 三 元 组 ; 没有 棍 垂直 摆 放 。 一 根 棍 仅 当 其 上 

没有 棍 放 置 时 可 以 取 走 。 

a. 解释 如 何 编写 一 个 例 程 接收 两 根 棍 oa 和 2” 并 报告 a 是 否 在 5 上 面 、b 下 面 ,或 是 与 
无关。( 本 问 与 图 论 毫 无 关系 。) 

b. 给 出 一 个 算法 确定 是 否 能 够 取 走 所 有 的 棍 ， 如 果 能 ， 那 么 提供 完成 这 项 工作 的 棍 
拾取 次 序 。 


.39 团 问 题 (clique problem) 可 以 叙述 如 下 : 给 定 无 向 图 G— (V, E)\M—-*BKMK, CGH 


含 一 个 最 少 K 个 顶点 的 完全 子 图 吗 ? 

顶点 改 盖 问题 (vertex cover problem) 可 以 叙述 如 下 : 给 定 无 向 图 G=(V, E)fü—^- 
整数 K，G 是 否 包含 一 个 子 集 V'cV 使 得 |V' |<K HAG 的 每 条 边 都 有 一 个 顶点 在 
V 中 ? 证 明 团 问题 可 以 多 项 式 地 归 约 成 顶点 覆盖 问题 。 


.40 ” 设 哈 密 尔 顿 圈 问 题 对 无 向 图 是 NP- 完 全 的 。 


a. 证 明 哈 密 尔 顿 圈 问 题 对 有 向 图 是 NP- 完 全 的 。 
b. 证 明 无 权 简单 最 长 路 径 问 题 对 有 向 图 是 NP- 完 全 的 。 


270 














343] 





数据 结构 与 算法 分 析 C 语言 描述 


9.41 棒球 卡 收藏 家 问题 (baseball card collector problem) 如 下 : 给 定 卡片 包 Pi, P2, 
Pu 以 及 一 个 整数 K ， 其 中 每 个 包 包 含 年 度 棒 球 卡 的 一 个 子 集 ， 问 是 否 可 能 通过 选择 
<K 个 包 而 搜集 到 所 有 的 棒球 卡 ? 证 明 棒 球 卡 收藏 家 问题 是 NP- 完 全 的 。 
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出 于 文献 [35]。 两 个 O( |Ellog log|V| ) 算 法 是 文献 [5] 和 [49]。 理 论 上 一 些 著名 算法 出 现 
在 文献 [15，17，30] 中 。 这 些 算法 的 经 验 性 研究 提出 ， 用 DecreaseKey 实现 的 Prim 算法 
在 实践 中 对 于 大 多 数 图 而 言 是 最 好 的 "1。 

关于 双 连 通 性 的 算法 来 自 文献 [44]。 第 一 个 线性 时 间 强 分 支 算法 (练习 9. 28) 也 出 现在 
这 篇 论文 中 。 课 文中 出 现 的 算法 归于 Kosaraju CAR ZZ X ) RI Sharir[43]。 深 度 优先 搜索 的 男 
外 一 些 应 用 见 文献 [ 25，26，45，46]( 正 如 第 8 章 提 到 的 ， 文献 [45-46] 中 的 结果 已 被 改进 ， 
但 是 基本 算法 没 变 )。 

NP- 完 全 问题 理论 的 经 典 的 介绍 性 工作 是 文献 [20]( 中 译本 : 计算 机 和 难 解 性 ， 张 立 昂 
等 译 , 科 学 出 版 社 ，1987 一 一 译 者 注 )。 在 文献 [1] 中 可 以 找到 另外 的 材料 。 可 满足 性 的 
NP- 完 全 性 在 文献 [7] 中 证 明 。 另 一 篇 开创 性 的 论文 是 文献 [31] ， 它 证 明了 21 个 问题 的 NP- 
完全 性 。 复 杂 性 理论 的 一 个 极 好 的 概括 性 论述 是 文献 [47]。 这 回 售货员 问题 的 一 个 近似 算 
法 可 在 文献 [38] 中 找到 ， 它 一 般 给 出 几 近 最 优 的 结果 。 

练习 9. 8 的 解法 可 以 在 文献 [2] 中 找到 。 对 于 练习 9.13 中 二 分 匹配 问题 的 解法 可 见 文 
献 [23，36]。 该 问题 可 通过 给 边 赋 权 并 除 掉 图 是 二 分 的 限制 而 得 以 推广 。 一 般 图 的 无 权 匹 
配 问题 的 有 效 解法 是 相当 复杂 的 ， 可 以 从 文献 [11，16，18] 中 找到 其 细节 。 

练习 9. 35 处 理 平 面 图 ， 它 通 第 产生 于 实践 。 平 面 图 是 非常 黎 臣 的 ， 许 多 困难 问题 以 平 
面 图 的 方式 处 理会 更 容易 。 有 一 个 例子 是 图 的 同 构 问 题 ， 对 于 平面 图 它 是 线性 时 间 可 解 
的 2 。 对 于 一 般 的 图 ， 尚 不 知 有 多 项 式 时 间 算 法 。 
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数据 结构 与 算法 分 析 C 语言 描述 


迄今 ， 我 们 已 经 涉及 一 些 算法 的 有 效 实 现 。 我 们 看 到 ， 当 一 个 算法 给 定时 ， 实 际 的 数 
据 结 构 无 须 指定 。 为 使 运行 时 间 尽 可 能 地 少 ， 需 要 由 编程 人 员 来 选择 适当 的 数据 结构 。 

本 章 将 把 注意 力 从 算法 的 实现 转向 算法 的 设计 。 到 现在 为 止 ， 我 们 已 经 看 到 的 大 部 分 
算法 都 是 直接 的 和 简单 的 。 第 9 章 包含 的 一 些 算 法 要 深奥 得 多 ， 有 些 需 要 (在 有 些 情形 下 很 
长 的 ) 论 证 以 证 明 它 们 确实 是 正确 的 。 在 这 一 章 , 我 们 将 集中 讨论 用 于 求解 问题 的 五 种 通常 
类 型 的 算法 。 对 于 许多 问题 ， 很 可 能 这 些 方法 中 至 少 有 一 种 方法 是 可 以 解决 问题 的 。 特 别 
是 对 于 每 种 类 型 的 算法 ， 我 们 将 : 

© 看 到 一 般 的 处 理 方法 。 

e 考察 几 个 例子 (本 章 末尾 的 练习 题 提供 了 更 多 的 例子 ) 。 

e 在 适当 的 地 方 概括 地 讨论 时 间 和 空间 复杂 性 。 


10.1. 贪 禁 算 法 


我 们 将 要 考察 的 第 一 种 类 型 的 算法 是 贪 禁 算 法 (greedy algorithm)。 在 第 9 章 我 们 已 经 
看 到 三 类 贪 禁 算法 : Dijkstra 算法 、Prim 算法 和 Kruskal 算法 。 贪 禁 算 法 分 阶段 地 工作 。 
在 每 一 个 阶段 ， 可 以 认为 所 作 决 定 是 好 的 ， 而 不 考虑 将 来 的 后 果 。 一 般 来 说 ， 这 意味 着 选 
择 的 是 某 个 局 部 的 最 优 。 这 种 “眼下 能 够 拿 到 的 就 拿 ”的 策略 即 是 这 类 算法 名 称 的 来 源 。 
当 算法 终止 时 ,我 们 希望 局 部 最 优 就 是 全 局 最 优 。 如 果 是 这 样 的 话 ， 那 么 算法 就 是 正确 的 ; 
否则 ， 算 法 得 到 的 是 一 个 次 优 解 (suboptimal solution) 。 如 果 不 要 求 绝 对 最 佳 答案 ,那么 有 
时 会 用 简单 的 贪 禁 算法 来 生成 近似 答案 ， 而 不 是 使 用 一 般 产 生 准 确 答案 所 需要 的 复杂 算法 。 

有 几 个 现实 的 贪 禁 算 法 的 例子 。 最 明显 的 是 找 零 钱 问题 。 为 了 使 用 美国 货币 找 零钱 ， 
我 们 重复 地 配 发 最 大 额 货币 。 于 是 ， 为 了 找 出 十 七 美元 六 十 一 美 分 的 零钱 ， 我 们 拿 出 一 张 
十 美元 钞 、 一 张 五 美元 钞 、 两 张 一 美 元 钞 、 两 个 二 十 五 美 分 币 、 一 个 十 美 分 币 以 及 一 个 一 
美 分 币 。 这 么 做 可 以 保证 使 用 最 少 的 钞票 和 硬币 。 这 个 算法 不 是 对 所 有 的 货币 系统 都 行 得 
通 ， 但 幸运 的 是 ， 我 们 可 以 证 明 它 对 美国 货币 系统 是 正确 的 。 事 实 上 ， 即 使 允许 使 用 两 美 
元 钞 和 五 十 美 分 币 ， 该 算法 仍然 是 可 行 的 。 

还 有 一 个 关于 交通 问题 的 例子 ,在 这 个 例子 中 ， 进 行 局 部 最 优选 择 不 总 是 行 得 通 的 。 例 
如 ， 在 迈阿密 的 某 些 交 通 高 峰 期 间 ， 即 使 一 些 主要 马路 看 起 来 空荡荡 的 ， 你 最 好 还 是 把 车 停 
在 这 些 街道 以 外 ， 因 为 交通 将 会 沿 着 马路 阻塞 一 英里 长 ， 你 也 就 被 堵 在 那里 动弹 不 得 。 有 时 
甚至 更 糟 ， 为 了 回避 所 有 的 交通 隘口 ， 最 好 是 朝 着 你 的 目的 地 相反 的 方向 临时 绕道 行驶 。 

本 节 其 余部 分 将 考察 几 个 使 用 贪 焚 算 法 的 应 用 。 第 一 个 应 用 是 简单 的 调度 问题 。 实 际 上 ， 
所 有 的 调度 问题 或 者 是 NP- 完 全 的 (或 类 似 的 难度 )， 或 者 是 贪 禁 算 法 可 解 的 。 第 二 个 应 用 处 理 
文件 压缩 ， 它 是 计算 机 科学 最 早 的 成 果 之 一 。 最 后 ， 我 们 将 介绍 一 个 贪 禁 近 似 算法 的 例子 。 


10. 1.1 一 个 简单 的 调度 问题 


今 有 作业 广 ，j;，…，jn， 已 知 对 应 的 运行 时 间 分 别 为 ，t;，…，tw， 而 处 理 器 只 有 
一 个 。 为 了 把 作业 平均 完成 的 时 间 最 小 化 ， 调 度 这 些 作 业 最 好 的 方式 是 什么 ”整个 这 一 节 
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我 们 将 假设 使 用 非 预 占 调度 (nonpreemptive scheduling): 一 旦 开始 一 个 作业 ， 就 必须 把 该 
作业 运行 完 。 

例如 ， 设 我 们 有 四 个 作业 和 相关 的 运行 时 间 ， 如 图 10-1 所 示 。 一 个 可 能 的 调度 在 
图 10-2 中 给 出 。 因 为 坟 用 15 个 时 间 单 位 ，j, 到 23 完成 ，j; 到 26 而 j, 到 36 完成 ， 所 以 
平均 完成 时 间 为 25。 一 个 更 好 的 调度 如 图 10-3 所 示 ， 它 产生 的 平均 完成 时 间 为 17. 75。 

图 10-3 给 出 的 调度 是 按照 最 短 的 作业 最 先进 行 来 安排 的 。 我 们 可 以 证 明 这 将 总 会 产生 
一 个 最 优 的 调度 。 令 调度 表 中 的 作业 是 j; ，j;, ，…，j;、。 第 一 个 作业 以 时 间 4 完成。 第 二 
个 作业 在 点 十 后 完成 而 第 三 个 作业 在 十 总 十 点 后 完成 。 由 此 我 们 看 到 ， 该 调度 总 的 代 
ffr CA 
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。 图 10-1 作业 和 时 间 图 10-2 1 号 调度 
js J | Js Ji 
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图 10-3 2 号 调度 (最 优 ) 


注意 ， 在 方程 (10. 2) 中 第 一 个 求 和 与 作业 的 排序 无 关 ， 因 此 只 有 第 二 个 求 和 影响 到 总 
开销 。 设 在 一 个 排序 中 存在 oy 使 得 4 一 4 。 此 时 ， 计 算 表明 ， 交 换 j 和 j，， 第 二 个 和 
增加 ， 从 而 降低 了 总 的 开销 。 因 此 ， 所 用 时 间 不 是 单调 非 减 的 任何 的 作业 调度 必然 是 次 优 

。 剩 下 的 只 有 那些 其 作业 按照 最 小 运行 时 间 最 先 安排 的 调度 是 所 有 调度 方案 中 最 优 的 。 

这 个 结果 指出 为 什么 操作 系统 调度 程序 一 般 把 优先 权 赋予 那些 更 短 的 作业 。 

多 处 理 器 的 情况 

我 们 可 以 把 这 个 问题 扩展 到 多 个 处 理 器 的 情形 。 我 们 还 是 有 作业 亡 , jo ee jM 
应 的 运行 时 间 分 别 为 站, 六，…，i， 另 外 处 理 器 的 个 数 为 P。 不 失 一 般 性 ， 我 们 将 假设 作 
业 是 有 序 的 ， 最 短 的 最 先 运行 。 作 为 一 个 例子 ， 设 P= 二 3， 而 作业 则 如 图 10-4 所 示 。 

图 10-5 显示 一 个 最 优 的 安排 ， 它 把 平均 完成 时 间 优化 到 最 小 。 作 业 方 、 六 A je 在 处 理 
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为 165， 3:35.19 — 18. 33。 
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作业 | 时 间 | e 
Ims 3 jı ja | jy 
i h 5 
| 5 6 | | | 
js 10 | Ja Js | Js 
| js 1 | 
je 14 | E o 
jr i J3 Je Jo | 
js 18 | | 
b 20 o — - — 一 一 一 2 
z 0 3 $6 13 16 20 28 34 40 
图 10-4 作业 和 时 间 10-5 ”多 处 理 器 情形 的 一 个 最 优 解 


解决 多 处 理 器 情形 的 算法 是 按 顺序 开始 作业 ， 处 理 器 之 间 轮 换 分 配 作 业 。 不 难 证 明 没 

有 哪个 其 他 的 顺序 能 够 做 得 更 好 ， UR o 

处 理 器 个 数 已 能 够 整除 作业 数 N 时 存 al js | ie 

在 许多 最 优 的 顺序 。 对 于 每 一 个 0 去 ;一 i | | 

N/P, FEM jo. 直到 jos pe 8E— T TE J2 | J4 h | 

业 放 到 不 同 的 处 理 器 上 ， 我们 可 以 得 到 | = —Ó 

这 样 的 最 优 顺 序 。 在 我 们 的 例子 中 ， a je a 

图 10-6 指出 了 第 二 个 最 优 解 。 ó. 53 36 1415 20 30 34 38 
即使 P. 不 恰好 整除 N ， 哪 怕 所 有 的 

作业 时 间 是 互 异 的 ， 也 还 是 有 许多 最 优 
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图 10-6 ”多 处 理 器 情形 的 第 二 个 最 优 解 














解 。 我 们 把 进一步 的 考察 留 作 练习 。 | | 

将 最 后 完成 时 间 最 小 化 iai RE : 

在 本 节 最 后 ， 考 虑 一 个 非常 类 似 的 | a 
问题 。 假 设 我 们 只 关注 最 后 的 作业 的 结 | 5 | 
束 时 间 。 在 上 面 的 两 个 例子 中 它们 的 | | | 
完成 时 间 分 别 是 40 和 38。 图 10-7 指 出 | | | | l 
最 小 的 最 后 完成 时 间 是 34， 而 这 个 结果 0 35 9 le 0 
显然 不 能 再 改进 了 ， 因 为 每 一 个 处 理 器 图 10-7 将 最 后 完成 时 间 最 小 化 


都 在 一 直 忙 着 。 

虽然 这 个 调度 没有 最 小 平均 完成 时 间 , 但 是 它 有 个 优点 ， 即 整个 序列 的 完成 时 间 更 早 。 
如 果 同 一 个 用 户 拥 有 所 有 这 些 作 业 ， 那 么 该 调度 是 更 可 取 的 调度 方法 。 虽然 这 些 问题 非常 相 
似 , 但 是 这 个 新 问题 实际 上 是 NP- 完 全 的 ; 它 恰 是 背包 问题 或 装 箱 问 题 的 另 一 种 表述 方式 ， 后 
面 在 本 章 还 将 遇 到 它 。 因 此 ， 将 最 后 完成 时 间 最 小 化 显然 要 比 把 平均 完成 时 间 最 小 化 困难 得 多 。 


10.1.2 Huffman 编码 


PEA, RTT IE RAEI — OR s BOR CER Cile compression) , 
标准 的 ASCI 字符 集 由 大 约 100 个 “可 打印 ”字符 组 成 。 为 了 把 这 些 字 符 区 分 开 来 ， 
需要 「 log 100 1=7 位 (bit 一 一 二 进 制 位 )。 但 7 位 可 以 表示 128 个 字符 ， 因 此 ASCI 字符 还 





第 10 章 算法 设计 技巧 277 


可 以 再 加 上 一 些 其 他 的 “ 非 打 印 ” 字 符 。 我 们 加 上 第 8 个 位 作为 奇偶 校 验 位 。 不 过 ， 重 要 
的 问题 在 于 ， 如 果 字 符 集 的 大 小 是 C， 那 么 在 标准 的 编码 中 就 需要 『 log C1 位 。 

设 我 们 有 一 个 文件 ， 它 只 包含 字符 a、e、i、s、t， 加 上 一 些 空格 和 换行 (newline)。 进 
一 步 设 该 文件 有 10 个 a、15 个 e、12 个 i、3 个 s、4 个 t、13 个 空格 以 及 一 个 换行 。 如 
图 10-8 所 示 ， 这 个 文件 需要 174 位 来 表示 ， 因 为 有 58 个 字符 ， 而 每 个 字符 需要 3 位 。 

在 现实 当中 ,文件 可 能 是 相当 大 的 。 许 多 非常 大 的 文件 是 某 个 程序 的 输出 数据 ， 而 在 
使 用 频率 最 大 和 最 小 的 字符 之 间 通 常 存在 很 大 的 差别 。 例 如 ， 许 多 巨大 的 文件 都 含有 很 多 
很 多 的 数字 、 空 格 和 换行 ， 但 是 a 和 x 却 很 少 。 如 果 在 慢 速 的 电话 线 上 传输 这 些 信 息 ， 那 
么 我 们 就 会 希望 减少 文件 的 大 小 。 还 有 ， 由 于 实际 每 一 台 : 
机 器 上 的 磁盘 空间 都 是 非常 珍贵 的 ， 因 此 人 们 就 会 想到 是 E S SORTE 
和 否 有 可 能 提供 一 种 更 好 的 编码 降低 总 的 所 需 位 数 。 4 “© — 5 — 5 

答案 是 肯定 的 ， 一 种 简单 的 策略 可 以 使 一 般 的 大 型 文 TE GE . 
件 节省 25%， 而 使 许多 大 型 的 数据 文件 节省 多 达 5096 — | nk Qo BO 
60%。 这 种 一 般 的 策略 就 是 对 于 不 同 字 符 让 代码 的 长 度 是 | 换行 110 1 3 


























变化 不 等 的 ， 同 时 保证 经 常 出 现 的 字符 其 代码 短 。 注 意 ， | 98 14 
如 果 所 有 的 字符 都 以 相同 的 频率 出 现 ， 那 么 要 节省 空间 是 。 图 10.8 使 用 一 个 标准 编码 方案 
不 可 能 的 。 
代表 字母 的 二 进 制 代码 可 以 用 二 又 树 来 表示 ， 如 图 10-9 所 示 。 
Esc 
E DOS 
£r 内 EX X2 
JS o wd m OG p 8 


图 10-9 原始 代码 的 二 叉 树 表示 法 


图 10-9 中 的 树 只 在 树叶 上 有 数据 。 每 个 字符 通过 从 根 节点 开始 用 0 指示 左 分 支 用 1 指 
示 右 分 支 以 记录 路 径 的 方法 表示 出 来 。 例 如 ，s 通过 从 根 向 左 走 ， 然 后 向 右 ， 最 后 再 向 右 而 
达到 ， 于 是 它 可 编码 成 011。 这 种 数据 结构 有 时 叫 作 trie 树 。 如 果 字 符 c 在 深度 d; 处 并 且 
出 现 f; 次 ， 那 么 该 字符 代码 的 值 (cost) 就 等 于 24d;f;。 

可 以 利用 换行 (nD) 是 仅 有 的 一 个 儿子 而 得 到 一 种 比 图 10-9 给 出 的 代码 更 好 的 代码 。 通 
过 把 换行 符号 放 到 其 更 高 一 层 的 父 节 点 上 ， 我 们 得 到 图 10-10 中 新 的 树 。 这 棵 新 树 的 值 是 
173， 但 该 值 仍 然 远 没有 达到 最 优 。 
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TER. Al 10-10 中 的 树 是 一 棵 满 树 (full tree): 所 有 的 节点 或 者 是 树叶 ， 或 者 有 两 个 儿 
子 。 一 种 最 优 的 编码 将 总 具有 这 个 性 质 ， 和 否则 正如 我 们 已 经 看 到 的 ， 具 有 一 个 儿子 的 节点 
可 以 向 上 移动 一 层 。 

如 果 字 符 都 只 放 在 树叶 上 ， 那 么 任何 位 序列 总 能 被 毫 无 歧义 地 译 码 。 例 如 ， 编 码 串 是 
0100111100010110001000111。0 不 是 字符 代码 ，01 也 不 是 字符 代码 ， 但 010 Æi, TEP 
一 个 字符 是 1。 然后 跟着 的 是 011， 它 是 字符 s。 其 后 的 11 是 换行 符 。 剩 下 的 代码 分 别 是 a, 
空格 、t、i、e 和 换行 符 。 因 此 ， 这 些 字符 代码 的 长 度 是 否 不 同 并 不 要 紧 ， 只 要 没有 字符 代 
码 是 别 的 字符 代码 的 前 缀 即 可 。 这 样 一 种 编码 叫 作 前 缓 编码。 相反 ， 如 果 一 个 字符 放 在 非 
树叶 节点 上 ， 那 就 不 再 能 够 保证 译 码 没有 二 义 性 。 

综 上 所 述 ， 我 们 看 到 ， 基 本 的 问题 在 于 找到 (如 上 定义 的 ) 总 价值 最 小 的 满 二 又 树 ， 

中 所 有 的 字符 都 位 于 树叶 上 。 图 10-11 中 的 树 显示 该 例 简 单字 母 表 的 最 优 树 。 如 图 10-12 所 
示 ， 这 种 编码 只 用 了 146 位 。 
































X. of. 
p s 字符 R 频率 

Bie TA a 001 10 30 

"E d Ns Baa : 01 15 30 

«x ee) i) © i 10 12 24 

E N s 00000 3 15 

A (a) t 0001 4 16 

di vA 空格 11 i$ 3 26 

FA. KU 换行 00001 1 5 
on fni) | 总 和 146 | 

图 10-11 最 优 前 组 编码 10-12 Bx ft By Be fa 3 

注意 ， 存 在 许多 最 优 的 编码 。 这 些 编码 可 以 通过 交换 编码 树 中 的 儿子 节点 得 到 。 此 时 ， 
主要 的 未 解决 的 问题 是 如 何 构造 编码 树 。1952 年 Huffman 给 出 了 一 个 算法 。 因 此 ， 这 种 编 


人 码 系 统 通 常 称 为 Huffman 编码 (Huffman code) , 

Huffman 算法 

本 小 节 将 假设 字符 的 个 数 为 C。Huffman 算法 可 以 描述 如 下 : 算法 针对 一 个 由 树 组 成 的 森 

。 一 棵 树 的 权 等 于 它 的 树叶 的 频率 的 和 。 任 意 选取 有 最 小 权 的 两 棵 树 TT 和 T,， 并 任意 形成 
以 T, AT, 为 子 树 的 新 树 ， 将 这 样 的 过 程 进行 C 一 1 次 。 在 算法 的 开始 ， 存 在 C 棵 单 节点 
树 一 一 每 个 字符 一 棵 。 在 算法 结束 时 得 到 一 棵 树 ， 这 棵 树 就 是 最 优 Huffman 编码 树 。 

我 们 通过 一 个 具体 例子 来 搞 清 算法 的 操作 。 图 10-13 表示 的 是 初始 的 森林 ; 每 棵 树 的 
权 在 根 处 以 小 号 数字 标 出 。 将 两 棵 权 最 低 的 树 合并 到 一 起 ， 由 此 建立 了 图 10-14 中 的 森林 。 
DO 六 名 为 T， ， 这 样 可 以 确切 无 误 地 表述 进一步 的 合并 。 图 中 我 们 令 s 是 左 儿 子 ， 

这 里 ， 令 其 为 左 儿 子 还 是 右 儿 子 是 任意 的 ;注意 可 以 使 用 Huffman 算法 描述 中 的 任意 性 。 

新 树 的 总 权 正 是 那些 老 树 的 权 的 和 ， 当 然 也 就 很 容易 计算 。 由 于 建立 新 树 只 需 得 出 一 个 新 


节点 ， 建 立 左 指针 和 右 指 针 并 把 权 记 录 下 来 ， 因 此 创建 新 树 很 简单 。 
(ay (e) Gy (s) ( (sp). (nt) 


图 10-13 Huffman 算法 的 初始 状态 


第 10 章 


(ry 
/ 7X0 NIS xg Z8 / 13 PN XT IN 
OQ oO Q oO Q(|e © à 
图 10-14 第 一 次 合并 后 的 Huffman 算法 
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现在 有 六 棵 树 ， 我 们 再 选取 两 棵 权 最 小 的 树 。 这 两 棵 树 是 T, 和 tt， 然后 将 它们 合并 成 一 
棵 新 树 ， 树 根 在 人 ， 权 是 8， 见 图 10-15。 第 三 步 将 T: 和 a 合并 建立 T;， 其 权 为 10 十 8 二 18。 


图 10-16 显示 这 次 操作 的 结果 。 


(r) 
(T) (t) 
o OG G c © 9 
图 10-15 第 二 次 合并 后 的 Huffman 算法 
D 
(1) (a) 
a © 
(ey G y ( Sp ( sj (nl) 


图 10-16 第 三 次 合并 后 的 Huffman 算法 


在 第 三 次 合并 完成 后 ， 最 低 权 的 两 棵 树 是 代表 i 和 空格 (sp) 的 两 个 单 节点 树 


出 这 两 棵 树 如 何 合并 成 根 在 T. 的 新 树 。 第 五 步 合并 根 为 e 和 T 的 树 ， 因 为 这 


最 小 。 该 步 结果 如 图 10-18 所 示 。 


rs 
(73) 
(5) (a) 
a E 
(Tj) (T) (t) 
一 \15 —~ > ~ 
© Q © © à 
图 10-17 第 四 次 合并 后 的 Huffman 算法 
(Ty 
T) (e) 
5 
© (a) 
mwN 一 、 —~ 
(T) 心 Q) 
G ® © Q 


图 10-18 ”第 五 次 合并 后 的 Huffman 算法 


。 图 10-17 指 


两 棵 树 的 权 


最 后 ， 将 两 个 剩 下 的 树 合 并 得 到 图 10-11 所 示 的 最 优 树 。 图 10-19 画 出 这 棵 最 优 树 ， 其 


RTE T。。 


我 们 将 概述 Huffman 算法 产生 最 优 代码 的 证 明 思 路 ,详细 的 细节 将 留 作 练 习 。 首 先 ， 
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由 反 证 法 不 难 证 明 树 必然 是 满 的 ， 因 为 我 们 已 经 看 到 一 棵 不 满 的 树 是 如 何 改 进 成 满 树 的 。 
其 次 ,我 们 必须 证 明 两 个 频率 最 


小 的 字符 a 和 8 必 是 两 个 最 深 的 节点 ae 
(虽然 其 他 节点 可 以 同样 地 深 )。 这 通 z^ RA 
过 反 证 法 同样 容易 得 证 ， 因 为 如 果 a e © GO 8 
8 不 是 最 深 的 节点 ， 那 么 必然 存在 某 个 Aur © 

7 是 最 深 的 节点 ( 记 住 树 是 满 的 )。 如 果 gr — 


a 的 频率 小 于 y， 那 么 我 们 可 以 通过 交 CY W 
换 它 们 在 树 中 的 位 置 而 改进 权 的 值 。 

然后 我 们 可 以 论证 ， 在 相同 深度 
上 任意 两 个 节点 处 的 字符 可 以 交换 而 不 影响 最 优 性 。 这 说 明 ， 总 可 以 找到 一 棵 最 优 树 ， 它 
含有 两 个 最 不 经 常 出 现 的 符号 作为 兄弟 ; 因此 第 一 步 没 有 错 ， 成 立 。 

证 明 可 以 通过 归纳 法 论证 完成 。 当 树 被 合并 时 ,我 们 认为 新 的 字符 集 是 在 根 上 的 那些 
字符 。 于 是 ， na i 经 过 四 次 合并 以 后 ,我 们 可 以 把 字符 集 看 成 由 与 元 字符 
T, WT, 组 成 。 这 灵 怕 是 证 明 最 微妙 的 部 分 ， 我们 要 求 读者 补足 所 有 的 细节 。 

该 算法 是 贪 禁 算法 的 原因 在 于 ， 在 每 一 阶段 我 们 都 进行 一 次 合并 而 没有 进行 全 局 的 考 
虑 。 我 们 只 是 选择 两 棵 最 小 的 树 。 

如 果 我 们 依 权 排序 将 这 些 树 保 存在 一 个 优先 队列 中 ,那么 ， 由 于 对 元 素 个 数 不 超过 C 
的 优先 队列 将 进行 一 次 BuildHeap. 2C—2 1X DeleteMin 和 C 一 2 次 Insert， 因 此 运行 
时 间 为 OCC log C) 。 使 用 一 个 链表 简单 实现 该 队列 将 给 出 一 个 O(C ) 算 法 。 优 先 队 列 实现 
方法 的 选择 取决 于 C 有 多 大 。 在 ASCI 字符 集 的 典型 情况 下 ，C 是 足够 小 的 ， 这 使 得 二 次 
的 运行 时 间 是 可 以 接受 的 。 在 这 样 的 应 用 中 ， 实 际 上 几乎 所 有 的 运行 时 间 都 将 花费 在 读 人 
输入 文件 和 写 出 压缩 文件 所 需要 的 磁盘 L/O LE. 

有 两 个 细节 必须 要 考虑 。 首 先 ， 在 压缩 文件 的 开头 必须 要 传送 编码 信息 ， 和 否则 将 不 可 
能 译 码 。 做 这 件 事 有 几 种 方法 ， 见 练习 10. 4。 对 于 一 些小 文件 ， 传 送 编码 信息 表 的 代价 将 
超过 压缩 带 来 的 任何 可 能 的 节省 ， 最 后 的 结果 很 可 能 是 文件 扩大 。 当 然 ， 这 可 以 检测 到 且 
原文 件 可 原样 保留 。 对 于 大 型 文件 ， 信 息 表 的 大 小 是 无 关 紧 要 的 。 

第 二 个 问题 是 : 该 算法 是 一 个 两 趟 扫描 算法 。 第 一 遍 搜 集 频 率 数据 ， 第 二 遍 进行 编码 。 
显然 ， 对 于 处 理 大 型 文件 的 程序 来 说 这 个 性 质 不 是 我 们 所 和 希望 的 。 某 些 另 外 的 做 法 在 参考 
文献 中 做 了 介绍 。 


图 10-19 最 后 一 次 合并 后 的 Huffman 算法 


10. 1.3 近似 装 箱 问 题 

在 这 一 节 ， 我 们 将 考虑 某 些 装 箱 问题 (bin packing problem) 的 算法 。 这 些 算法 将 运行 得 
IRR, 但 未 必 产 生 最 优 解 。 不 过 ， 我们 将 证 明 所 产生 的 解 距 最 优 解 不 太 远 。 

设 给 定 N 件 物 品 ， 大 小 为 s ，s; ，…，svy， 所 有 的 大 小 都 满足 0 二 s; 三 1。 问题 是 要 把 
这 些 物 品 装 到 最 小 数目 的 箱子 中 , 已 知 每 个 箱子 的 容量 是 1 个 单位 。 作 为 例子 ， 
图 10-20 显示 把 大 小 为 0.2，0.5，0.4，0.7，0. 1, 0.3, 0. 8 的 一 批 物品 最 优 装 箱 的 方法 。 
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有 两 种 版 本 的 装 箱 问题 。 第 一 种 是 联机 (on-line) 装 箱 问题 。 在 这 种 问题 中 ， 必 须 将 每 

一 件 物品 放 和 人 一 个 箱子 之 后 才 处 理 下 一 件 物品 。 第 二 种 是 脱 机 (off-line) 装 箱 问 题 。 在 一 

脱 机 装 箱 算法 中 ， 我 们 做 任何 事 都 需要 等 到 所 有 的 输入 数 。 一 一 一 一 

据 全 被 读 人 之 后 才 进行 。 联 机 算法 和 脱 机 算法 之 间 的 区 别 | LA 05 
0.8 

















在 8.2 节 讨 论 过 。 | | Lay 
联机 算法 | | S 
要 考虑 的 第 一 个 问题 是 ， 一 个 联机 算法 即使 在 允许 无 o2 | S 

限 计算 的 情况 下 是 否 实际 上 总 能 给 出 最 优 的 解答 。 我 们 知 “而 a "a 

道 ， 即 使 允许 无 限 计算 ， 联 机 算法 也 必须 先 放 人 一 件 物品 图 10.20 对 02 05 04 07, 
后 才能 处 理 下 一 件 物品 并 且 不 能 改变 决定 。 01, 03, 08 的 最 优 
为 了 证 明 联机 算法 不 总 能 够 给 出 最 优 解 ， 我 们 将 给 它 一 ei 


组 特别 难 的 数据 来 处 理 。 考虑 由 重量 为 二 一 的 M 个 小 项 和 其 后 重量 为 元 +e 的 M 个 大 项 构 


PAPA 1, 06 Gee, I, RITES E A 
么 这 些 物品 可 以 放 入 M 个 箱子 中 。 假 设 存在 一 个 最 优 联机 算法 A 可 以 进行 这 项 装 条 工作。 考虑 
算法 A 对 序列 D 的 操作 ， 该 序列 只 由 重量 为 也 一 e 的 M 个 小 项 组 成 。 是 可 以 装 入 | M/21 个 箱 
子 中 的 。 然 而 ， 由 于 A 对 序列 的 处 理 结果 必然 和 对 的 前 半 部 分 处 理 结果 相同 ， 而 D, 前 半 部 
分 的 输入 跟 I 的 输入 完全 相同 ， 因 此 A 将 把 每 一 件 物品 放 到 一 个 单独 的 箱子 内 。 这 说 明 A 将 使 
用 的 箱子 的 个 数 是 使 用 Le 最 优 解 的 两 倍 。 这 样 我 们 证 明了 ， 对 于 联机 装 箱 问题 不 存在 最 优 算法 。 

上 面 的 论述 指出 ， 联 机 算法 从 不 知道 输入 何 时 会 结束 ， 因 此 它 提供 的 任何 性 能 保证 必 
须 在 整个 算法 的 每 一 时 刻 成 立 。 如 果 遵 循 前 面 的 策略 ， 那 么 我 们 可 以 证 明 下 列 定理 。 


定理 10. 1 存在 使 得 任意 联机 装 箱 算法 至 少 使 用 去 3 最 优 箱子 数 的 输入 。 


: 假设 情况 相反 ， 为 简单 起 见 设 M 是 偶数 。 pn 列 I 上 的 联 
sie P 注意 ， 该 序列 由 M 个 小 项 后 接 M 个 大 项 组 成 。 让 我 们 考虑 该 算法 在 处 理 第 M 项 
后 都 做 了 什么 。 设 A 已 经 用 了 2 个 箱子 。 在 此 刻 ， 箱 子 的 最 优 个 数 是 M/2， 因 为 我 们 可 以 在 


每 个 箱子 里 放 入 两 件 物品 。 于 是 我 们 知道 ， 根据 我 们 的 低 于 的 性 能 保证 的 假设 ， 20/M< 人。 


现在 考虑 在 所 有 的 物品 都 被 装 箱 后 算法 A 的 性 能 。 在 第 / 个 箱子 之 后 开辟 的 所 有 箱子 
每 箱 恰 好 包含 一 件 物品 ， 因 为 所 有 小 物品 都 被 放 在 了 前 4 个 箱子 中 ， 而 两 件 大 物品 又 装 不 
进 一 个 箱子 中 去 。 由 于 前 4 个 箱子 每 箱 最 多 能 有 两 件 物品 ， 而 其 余 的 箱子 每 箱 都 有 一 件 物 
品 ， 因 此 我 们 看 到 ， 将 2M 件 物品 装 箱 将 至 少 需要 2M — 5 个 箱子 。 但 2M 件 物 品 可 以 用 M 


个 箱子 最 优 装 箱 ， 因 此 我 们 的 性 能 保障 保证 得 到 (2M 一 )/M 二 。 
第 一 个 不 等 式 意味 着 b/M 二 与， 而 第 二 个 不 等 式 意味 着 0/M> 二 ,这 是 矛盾 的 。 因 此 ， 


没有 联机 算法 能 够 保证 使 用 小 于 的 最 优 装 箱 数 完成 装 箱 。 
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有 三 种 简单 算法 保证 所 用 的 箱子 数 不 多 于 二 倍 的 最 优 装 箱 数 。 也 有 颇 多 更 为 复杂 的 算 


法 能 够 得 到 更 好 的 结果 。 

下 项 适合 算法 

大 概 最 简单 的 算法 就 属 下 项 适合 Cnext 
fit) 算 法 了 。 当 处 理 任何 一 件 物品 时 ,我 们 检 
查看 它 是 否 还 能 装 进 刚 刚 装 进 物 品 的 同一 人 
箱子 中 。 如 果 能 够 装 进 去 ， 那 么 就 把 它 放 入 
该 箱 中 ; 否则 ， 就 开辟 一 个 新 的 箱子 。 这 个 
算法 实现 起 来 出 奇 的 简单 ， 而 且 还 以 线性 时 
间 运 行 。 图 10-21 显示 对 于 与 图 10-20 相同 的 
输入 所 得 到 的 装 箱 过 程 。 

下 项 适合 算法 不 仅 编 程 简单 ， 而 且 它 在 
最 坏 情 形 下 的 行为 也 容易 分 析 。 
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0. 3，0. 8 的 下 项 适合 算法 


定理 10.2 令 M 是 将 一 列 物品 工装 箱 所 需 的 最 优 装 箱 数 ， 则 下 项 适合 算法 所 用 箱 数 绝 
不 超过 2M 个 箱子 。 存 在 一 些 顺序 使 得 下 项 适合 算法 用 箱 2M 2 个 。 


证 明 : 考虑 任何 相 邻 的 两 个 箱子 B; 和 Bj... 


B, 和 Bi 中 所 有 物品 的 大 小 之 和 必然 大 


于 1， 和 否则 所 有 这 些 物 品 就 会 全 部 放 和 B, 中 。 如 果 我 们 将 该 结果 用 于 所 有 相 邻 的 两 个 箱子 ， 


那么 我 们 看 到 ， 

为 说 明 这 个 界 是 精确 的 ， 设 N 项 物品 ， 
当 i 是 奇数 时 ， 物 品 的 大 小 s; 王 0.5 而 当 ; 是 
偶数 时 s; 二 2/N。 设 NN 可 被 4 整除 。 图 10-22 
所 示 的 最 优 装 箱 由 含有 2 件 大 小 为 0.5 的 物 
mA) NM4 个 箱子 和 含有 N/2 件 大 小 为 2/N 
物品 的 一 个 箱子 组 成 ， 总 数 为 (N/4) + 1. 
图 10-23 表 示 下 项 适合 算法 使 用 N/2 个 箱子 。 
因此 ， 下 项 适合 算法 可 以 用 到 几乎 二 倍 于 最 
优 装 箱 数 的 箱子 。 


首次 适合 算法 
虽然 下 项 适合 算法 有 一 个 合理 的 性 能 保 
WE, 但 是 ， de 因为 


在 不 需要 开辟 新 箱子 的 时 候 它 却 开辟 了 新 箱 
子 。 在 前 面 的 样 例 运行 中 ， 本 可 以 把 大 小 0. 3 
的 物品 放 入 B, 或 Be 而 不 是 开辟 一 个 新 箱子 。 

首次 适合 (first fit) 算 法 的 策略 是 依 序 扫 
描 这 些 箱子 但 把 新 的 一 件 物 品 放 人 足以 盛 下 
它 的 第 一 个 箱子 中 。 因 此 ， 


项 多 有 一 半 的 空间 闲置 。 因 此 ， 下 项 适合 算法 最 多 使 用 二 倍 的 最 优 箱子 数 。 
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B] 10-23 54 0.5, 2/N, 0.5, 2/N, 0.5, 
2/N…… 的 下 项 适合 装 箱 法 


只 有 当先 前 放置 物品 的 箱子 已 经 没有 再 容 下 当前 物品 余地 的 时 
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ik, 我们 才 开 辟 一 个 新 箱子 。 图 10-24 指出 对 我 们 的 标准 输入 进行 首次 适合 算法 的 装 箱 
结果 。 


实现 首次 适合 算法 的 一 个 简单 方法 是 > 




















通过 顺序 扫描 箱子 序列 处 理 每 一 件 物品 ， or e || s| 
这 将 花费 OCN )。 有 可 能 以 OCN log N) iz | ái 
行 来 实现 首次 适合 算法 ， 我 们 把 它 留 作 Pe ELIT. 08 | 
练习 。 ux 

略 加 思索 读者 即 可 明白 ， 在 任意 时 刻 5— —E— GG 














最 多 有 一 个 箱子 其 空 出 的 部 分 大 于 箱子 的 
一 半 ， 因 为 若 有 第 二 个 这 样 的 箱子 ， 则 它 
装 的 物品 就 会 装 到 第 一 个 这 样 的 箱子 中 了 。 
因此 我 们 可 以 立即 断言 : 首次 适合 算法 保证 其 解 最 多 包含 最 优 装 箱 数 的 二 倍 。 

另 一 方面 ， 我 们 在 证 明 下 项 适合 算法 性 能 的 界 时 所 用 到 的 最 坏 情况 对 首次 适合 算法 不 
适用 。 因 此 ， 人 们 可 能 要 问 : 是 否 能 够 证 明 有 更 好 的 界 吗 ? 答案 是 肯定 的 ， 不 过 证 明 要 复 


m—, 


B] 10-24 540.2, 0.5, 0.4, 0.7, 0. 1, 
0.3，0. 8 的 首次 适合 装 箱 法 


定理 10.3 令 M 是 将 一 列 物品 1 装 箱 所 需要 的 最 优 箱子 数 ， 则 首次 适合 算法 使 用 的 箱 
子 数 绝 不 多 于 | IM |。 存 在 使 得 首次 运 合算 法 使 用 [5CM 一 1) 个 箱子 的 顺序 。 

证 明 : 参阅 本 章 末 尾 的 参考 文献 。 

使 用 首次 适合 算法 得 出 的 结果 和 前 面 定 
































空 | 
理 指出 的 结果 几乎 一 样 差 的 例子 见 图 10-25, UTE a " 
1 1/7+€ 
图 中 的 输入 由 6M 个 大 小 为 地 十 s 的 项 后 Od - 1/3+e | e eem 
1/7+€ 
1/2 
跟 6M PH He 的 项 以 及 接 下 来 6M me | vase " 
1/7+€ | 
B,By By. Bay B 4m+1 >B 10M 


AUN He 的 项 组 成 。 一 种 简单 的 装 


箱 办 法 是 将 每 种 大 小 的 各 一 项 物品 装 到 一 
个 箱子 中 ， 总 共 需 要 6M 个 箱子 。 如 用 首 
次 适合 算法 ， 则 需要 10M 个 箱子 。 

当 首 次 适合 算法 对 大 量 其 大 小 均匀 分 布 在 0 和 1 之 间 的 物品 进行 运算 时 ， 经 验 结果 指 
出 ， 首 次 适合 算法 用 到 大 约 比 最 优 装 箱 方 法 多 2% 的 箱子 。 在 许多 情况 下 ， 这 是 完全 可 以 接 
受 的 。 

最 佳 适合 算法 

我 们 将 要 考察 的 第 三 种 联机 策略 是 最 佳 适合 (best fit) 算 法 。 该 算法 不 是 把 一 件 新 物品 
放 入 所 发 现 的 第 一 个 能 够 容纳 它 的 箱子 ， 而 是 放 到 所 有 箱子 中 能 够 容纳 它 的 最 满 的 箱子 中 。 
典型 的 装 箱 方法 如 图 10-26 所 示 。 

注意 ， 大 小 为 0. 3 的 项 不 是 放 在 B. 而 是 放 在 了 B; ， 此 时 它 正好 把 B. 填 满 。 由 于 我 们 


10-25 ”首次 适合 算法 使 用 0M 个 而 不 是 
6M 个 箱子 的 情形 
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现在 对 箱子 进行 更 细致 的 选择 ， 因 此 人 们 可 能 认为 算法 性 能 保障 会 有 所 改善 。 但 是 情况 并 
非 如 此 ， 因 为 总 的 说 来 坏 情形 是 相同 的 。 最 佳 适 。 一 一 [一 一 "P 
合算 法 比 起 最 优 算法 ， 绝 不 会 坏 过 1.7 倍 左右 ， ps |" xm 





而 且 存在 一 些 输入 ， 对 于 这 些 输 入 该 算法 (几乎 ) | 
达到 这 个 界限 。 不 过 ， 最 佳 适合 算法 编程 还 是 简 。 PE 01 
单 的 ， 特 别 是 当 需 要 O(N log N) 算 法 的 时 候 ， 而 | BN SN 


























且 该 算法 对 随机 的 输入 确实 表现 得 更 好 。 —RR— — g^ —E 
脱 机 算法 10-26 xf 0.2, 0.5, 0.4, 0.7, 0.1, 
如 果 能 够 观察 全 部 物品 以 后 再 算出 答案 ， 屠 0. 3, 0.8 的 最 佳 适合 算法 
么 我 们 应 该 会 做 得 更 好 。 事 实 确实 如 此 ， 由 于 我 P oa ee 
们 通过 彻底 的 搜索 能 够 最 终 找到 最 优 装 箱 方法 ， | i.q pe 
因此 对 联机 情形 就 已 经 有 了 一个 理论 上 的 改进 。 | "| 
所 有 联机 算法 的 主要 问题 在 于 将 大 件 物品 装 ow | | 
箱 困难 ， 特 别 是 当 它们 在 输入 的 晚期 出 现 的 时 候 。 | | 52 
围绕 这 个 问题 的 自然 方法 是 将 各 项 排序 ， 把 最 大 L LL. 


的 物品 放 在 最 先 。 此 时 我 们 可 以 应 用 首次 适合 算 

法 或 最 佳 适合 算法 ， 分 别 得 到 首次 过 合 递减 (first MIA OR DUE OB 0 
fit decreasing) 算 法 和 最 佳 适合 递减 (best fit de- 

creasing) 算 法 。 图 10-27 指出 在 我 们 的 例子 中 这 会 产生 最 优 解 (尽管 在 一 般 的 情形 下 显然 未 
必 会 如 此 )。 

本 小 节 将 处 理 首次 适合 递减 算法 。 对 于 最 佳 适 合 递减 算法 ， 结 果 几 乎 是 一 样 的 。 由 于 
存在 物品 大 小 不 互 异 的 可 能 ， 因 此 有 些 作 者 更 愿意 把 首次 适合 递减 算法 叫 作 首次 适合 非 增 
(first fit nonincreasing) 算 法 。 我 们 将 沿用 原始 的 名 称 。 不 失 一 般 性 ， 我 们 还 要 假设 输入 数 
据 已 经 根据 大 小 排序 。 

我 们 能 够 做 的 第 一 个 评注 是 ， 首 次 适合 算法 使 用 10M 个 而 不 是 6M 个 箱子 的 坏 情形 在 
物品 已 排序 的 情况 下 不 会 再 发 生 。 我 们 将 证 明 ， 如 果 一 种 最 优 装 箱 法 使 用 M 个 箱子 ， 那 么 
首次 适合 递减 算法 使 用 的 箱子 数 绝 不 超过 (4M 十 1)/3 个 。 


这 个 结果 依赖 于 两 项 观察 。 首 先 ， 所 有 重量 大 于 广 的 项 将 被 放 入 前 M 个 箱子 内 。 这 意 


味 着 ， 在 外 加 的 箱子 中 所 有 各 项 的 重量 项 多 是 广 。 第 二 个 结论 是 ， 在 外 加 的 箱子 中 物品 的 
项 数 最 多 可 以 是 M 一 1。 把 这 两 个 结果 结合 起 来 我 们 发 现 ， 外 加 的 箱子 最 多 可 能 需要 
[CM 一 1)/3 1 个 。 现 在 我 们 证 明 这 两 项 观察 结果 。 

引 理 10.1 令 NN 项 物品 的 输入 大 小 (以 递减 顺序 排序 ) 分 别 为 si ，s,，…，sn， 并 设 最 
优 装 箱 方法 使 用 M 个 箱子 。 那 么 ， 首 次 适合 递减 算法 放 到 外 加 的 箱子 中 的 所 有 物品 的 大 小 


gl 
最 多 为 二。 
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WEBB: 设 第 i 件 物品 是 放 入 第 M 十 1 个 箱子 中 的 第 一 件 物品 。 我 们 需要 证 明 sci. 我 
们 将 使 用 反 证 法 证 明 这 个 结论 。 设 V 


HT BEP ah A AE DLE IORI. ALE. sese says HORE 


知 ， 所 有 的 箱子 Bi. Bo, +, Bu 每 个 最 多 只 有 两 件 物品 。 
考虑 在 第 i 一 1 件 物品 放 入 一 个 箱子 后 但 第 i 件 物品 尚未 放 入 时 系统 的 状态 。 现 在 我 们 


想 要 证 明 (在 二 于 的 假设 下 前 M 个 箱子 排列 如 下 : 首先 是 有 些 箱子 内 恰好 有 一 件 物品 ， 


然后 剩 下 的 箱子 内 有 两 件 物品 。 

设 有 两 个 箱子 B, AB, 使 得 1 x-—y«M, B. 有 两 项 而 B, 有 一 项 。 令 x, 和 zs Æ B, 
中 的 两 件 物品 ， 并 令 y Æ B, PHAR Oh. xmi AN x 被 放 在 较 前 的 箱子 中 。 根 据 
类 似 的 推理 x. >s A, ai tr >y ts. KERE s; 是 应 该 可 以 放 在 B, 中 的 。 根 据 我 


们 的 假设 ， 这 是 不 可 能 的 。 因 此 ， WE s. 那么 在 我 们 试图 处 理 s 时 ， 这 样 安排 前 M 


个 箱子 ， 使 得 前 7 个 箱子 各 装 一 件 物品 ， 而 后 M 一 7 个 箱子 各 放 两 件 物 品 。 

为 了 证 明 该 引 理 ， 我 们 将 证 明 不 存在 将 所 有 物品 装 人 M 个 箱子 的 方法 ， 这 和 引 理 的 假 
E 

， FE Sis Soo tet s 中 使 用 任何 算法 都 没有 两 项 可 以 放 入 一 个 箱子 中 ， 因 为 如 果 能 

放 ， EHE 我 们 还 知道 ， nd ni p» Spir, UU 
中 的 任意 一 项 放 入 前 7 个 箱子 中 ， 因 此 它们 都 不 适合 。 这 样 ， 在 任何 装 箱 方法 中 ， 特别 是 
最 优 装 箱 方法 中 ， 必 然 存 在 7 个 箱子 不 包含 这 些 项 。 由 此 可 知 ， 大 小 为 $j， Sjo to sea 
的 项 必然 包含 在 M — j 个 箱子 的 集合 中 , 考虑 到 前 面 的 讨论 ， 于 是 这 些 项 的 总 数 为 
2 一 


注意 ， 如果 Ls WARREN s 没有 方法 放 人 这 M 个 箱子 当中 的 一 个 ， 该 引 理 的 


证 明 也 就 完成 了 。 事 实 上 ， 显然 它 不 能 放 入 这 j 个 箱子 中 ， 因 为 假如 能 放 入 ， 那 么 首次 适 
合算 法 也 能 够 这 么 做 。 把 它 放 入 其 余 的 M 一 7 个 箱子 之 一 中 需要 把 2CM 一 站 十 1 件 物品 分 发 
到 这 M—; 个 箱子 中 。 因 此 ， 某 个 箱子 就 不 得 不 装 人 三 件 物品 ， 而 它们 中 的 每 一 件 都 大 于 


很 明显 ， 这 是 不 可 能 的 。 
这 与 所 有 大 小 的 物品 都 能 够 装 入 M 个 箱子 的 事实 矛盾 ， 因 此 开始 的 假设 肯定 是 不 正确 
的 ， Aii se. 

838 10.2. 放 入 外 加 的 箱子 中 的 物品 的 个 数 最 多 是 M 一 1。 


i 
p 9 


WEBB: 假设 放 入 外 加 的 箱子 中 的 物品 至 少 有 M 个 。 我 们 知道 31s, 过 M ， 因 为 所 有 的 





O ”首次 适合 算法 把 这 些 元 素 装 入 M 一 j 个 箱子 并 在 每 个 箱子 中 放 和 人 两 件 物品 。 因 此 有 2CM 一 7 项 。 
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物品 都 可 装 和 人 M 个 箱子 。 设 对 于 ISM, FFB 装 入 后 总 重 W;。 设 前 M 个 外 加 箱子 中 
的 物品 大 小 为 Tis ass cns mus DEBT. HP M 个 箱子 中 的 项 加 上 前 M 个 外 加 箱子 中 的 
项 是 所 有 物品 的 一 个 子 集 ， 于 是 


N M M M 


Sia = Nw; 2585 = > W, +z) 
=] 


MEW; +Hr>l, SWUM c, 的 项 就 已 经 放 入 B; 中 。 因 此 


N M 


j=) 


即 这 N BRR AM 个 箱子 中 是 不 可 能 的 。 因 此 ， 最 多 只 能 有 M 一 1 项 外 加 的 物品 。 

定理 10.4 令 M 是 将 物品 集装箱 所 需 的 最 优 箱子 数 ， 则 首次 适合 递减 算法 所 用 箱子 
数 绝 不 超过 (4M 十 1)/3。 

证 明 : 存在 M 一 1 项 外 加 的 箱子 中 的 物品 ， 其 大 小 至 多 为 计 。 因 此 ， 最 多 可 能 存在 


TCM 一 1)/3 1 个 其 余 的 箱子 。 从 而 ， 由 首次 适合 递减 算法 使 用 的 箱子 总 数 最 多 为 [(4M 一 1)/ 
3 1 二 (4M 十 1)/3。 


能 够 证 明 ， 对 于 首次 适合 递减 算法 和 下 项 适合 递减 算法 ， 都 有 一 个 紧 得 多 的 界 。 
定理 10.5 4- M 是 将 物品 集 I 装 箱 所 需 的 最 优 箱子 数 ， 则 首次 适合 递减 算法 所 用 箱子 


数 绝 不 超过 号 M 十 4。 此 外 ， 存 在 使 得 首次 适合 递减 算法 用 到 号 M 个 箱子 的 序列 


WEAR: 上 界 需要 非常 复杂 的 分 析 。 下 最 优 法 首次 适合 递减 法 
界 可 以 通过 下 述 序列 展示 : 先是 大 小 为 | 1/4 — 2e 14 -2e | 2 2 | 14 - 2e 


1 u- 
ote 6M Xl, Hine KAZ + 2e 的 Wee | 14-26 ee 











1⁄4 +€ ap - m 






































| — 
1 ree VA € 1⁄4 — 2€ 
6M 3j. PRET +e 的 6M 项 ， 最 后 是 | ，。 MID PS 
1 1/4 + 2€ 1⁄4+e | |14-2e| 
N e 的 12M 项 物品 。 图 10-28 指 B\—>Bom Bem Bom ByOBey Bem >BsmBsm >B iim 
出 最 优 装 箱 需要 OM 个 箱子 ， 而 首次 适合 。 图 10-28 首次 适合 递减 算法 使 用 11M 个 箱子 ， 但 
递减 算法 需要 11M 个 箱子 。 只 有 9M 个 箱子 就 足够 完成 装 箱 的 例子 


在 实践 中 ， 首 次 适合 递减 算法 的 效果 非常 好 。 如 果 大 小 在 单位 区 间 均 匀 分 布 ， 那么 外 


加 的 箱子 的 期 望 个 数 为 6(VM)。 装 箱 算法 是 简单 贪 禁 试探 算法 能 够 给 出 好 结果 的 一 个 好 
例子 。 


10.2 分 治 算法 

用 于 设计 算法 的 另 一 种 常用 技巧 为 分 治 (divide and conquer) 算 法 。 分 治 算法 由 两 部 分 
组 成 : 

e 分 (divide): 递归 解决 较 小 的 问题 (当然 ， 基 本 情况 除外 )。 

e 治 (conquer): 然后 ， 从 子 问 题 的 解构 建 原 问 题 的 解 。 
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传统 上 ， 在 正文 中 至 少 含有 两 个 递归 调用 的 例 程 叫 作 分 治 算法 ， 而 正文 中 只 含 一 个 递 
归 调 用 的 例 程 不 是 分 治 算法 。 我 们 一 般 坚 持 子 问 题 是 不 相交 的 ( 即 基 本 上 不 重 倒 )。 让 我 们 
回顾 本 书 涉及 的 某 些 递归 算法 。 

我 们 已 经 看 到 几 个 分 治 算法 。 在 2.4.3 节 我 们 见 过 最 大 子 序列 和 问题 的 一 个 
O(N log NN) 解 。 在 第 4 章 , 我 们 看 到 过 一 些 线性 时 间 的 树 遍 历 方法 。 在 第 7 章 ， 我 们 见 过 
分 治 算法 的 经 典 例子 ， 即 归并 排序 和 快速 排序 ， 它们 在 最 坏 情 形 以 及 平均 情形 分 别 有 
O(N log N) 的 时 间 界 。 

我 们 还 看 到 过 递归 算法 的 若干 例子 ， 在 分 类 上 它们 很 可 能 不 算 作 分 治 算法 ,而 只 是 化 
简 到 一 个 更 简单 的 情况 。 在 1.3 节 ， 我们 看 到 显示 一 个 数 的 简单 例 程 。 在 第 2 章 ， 我 们 使 
用 递归 执行 有 效 的 取 才 运算 。 在 第 4 章 ， 我 们 考察 了 二 又 查找 树 一 些 简 单 的 搜索 例 程 。 在 
6.6 节 ， 我 们 见 过 用 于 合并 左 式 堆 的 简单 的 递归 。 在 7.7 节 给 出 了 一 个 花费 线性 平均 时 间 解 
决 选择 问题 的 算法 。 第 8 章 递归 地 写 出 了 不 相交 集 的 Fina 操作 。 第 9 章 指 出 以 Dijkstra 
算法 重新 找 出 最 短路 径 的 一 些 例 程 以 及 对 图 进行 深度 优先 搜索 的 其 他 过 程 。 这 些 算 法 实际 
上 都 不 是 分 治 算法 ， 因 为 只 进行 了 一 次 递归 调用 。 

我 们 在 2. 4 节 还 看 到 计算 斐 波 那 契 数 的 很 不 好 的 递归 例 程 。 我 们 可 以 称 其 为 分 治 算法 ， 
但 它 的 效率 太 差 了 ， 因 为 问题 实际 上 根本 没有 被 分 割 。 

在 这 一 节 ， 我 们 将 看 到 分 治 算法 更 多 的 范例 。 第 一 个 应 用 是 计算 几何 中 的 问题 。 给 定 平 
面 上 的 NN 个 点 ,我们 将 证 明 最 近 的 一 对 点 可 以 在 OCN log N) 时 间 找 到 。 本 章 后 面 的 一 些 练习 
描述 了 计算 几何 中 另外 一 些 问题 ， 它 们 可 以 由 分 治 算法 求解 。 本 节 其 余部 分 证 明理 论 上 一 些 
极其 有 趣 的 结果 。 我 们 提供 一 个 算法 以 O(N) 最 坏 情 形 时 间 解 决 选择 问题 。 我 们 还 要 证 明 可 以 
用 ol(N?) 操 作 将 2 个 NN 位 的 数 相 乘 并 以 ol Ni ) 操 作 将 两 个 矩阵 相 乘 。 不 幸 的 是 ， 虽 然 这 些 算法 
最 坏 情 形 时 间 界 比 传统 算法 更 好 ， 但 如 果 输 入 并 不 特别 巨大 ， 则 它们 都 并 不 实用 。 


10.2.1 分 治 算法 的 运行 时 间 

我 们 将 要 看 到 的 所 有 有 效 的 分 治 算法 都 是 把 问题 分 成 一 些 子 问题 ， 每 个 子 问 题 都 是 原 
问题 的 一 部 分 ， 然 后 进行 某 些 附加 的 工作 以 算出 最 后 的 答案 。 举 一 个 例子 ,我 们 已 经 看 到 
归并 排序 对 两 个 问题 进行 运算 ， 每 个 问题 均 为 原 问题 大 小 的 一 半 ， 然 后 使 用 O(N) 附 加 工 
作 。 由 此 得 到 运行 时 间 方 程 ( 带 有 适当 的 初始 条 件 ) 

TON) —2TCN/2) -OCND 

我 们 在 第 7 章 看 到 ， 该 方程 的 解 为 O(N log N)。 下 面 的 定理 可 以 用 来 确定 大 部 分 分 治 
算法 的 运行 时 间 。 

定理 10.6 方程 T(N) 二 aT(N/b) 十 O(N*) 的 解 为 


OCN" ) X alb 
T(N) —40C(ON* log N) xac 
OCN*) arae 


P azl, b>. 
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证 明 : 根据 第 7 章 归 并 排序 的 分 析 ， 我 们 将 假设 N 是 5b 93€; 于是， 可 令 N= 二 0”。 此 
时 N/b—b"^! & Nt —(p")* =b™ —p" = 二 (6*)"。 让 我 们 假设 T(1)==1， 并 忽略 GCN*) 中 的 常 
KAF. WA 








T(b") = aT OE 
如 果 我 们 用 a" 除 两 边 ， 则 得 到 




















m m-— E is 
TO D Tq ) - (10. 3) 
a a 
我 们 可 以 对 m 的 其 他 值 应 用 该 方程 ， 得 到 
7 一 1 m—2 k ym-l 
Poor) T+ (| ane 
a a a 
m—2 m-3 S qu 
To" ) Tu wa le | (10. 5) 
a * a a 
1 0 kyl 
To». TO) | | (10. 6) 
a a 





我 们 使 用 将 式 (10. 30 8] 3X C10. 60 BBR 75 EE P1371 2 30] JI EE DIE AY p ERI. GES ALY A 3A 
实际 上 与 等 号 右边 的 前 一 项 相 消 ， 由 此 得 到 





NO =“ BE 
IU E (10. 7) 
a" Lx 2:5 | 
m k i 
= Xi) (10. 8) 
i=0 a 
因此 
m bt i 
TON) = TG) = a" T) (10. 9) 


i=0 


如 果 “之 多， 那么 和 就 是 一 个 公 比 小 于 1 的 几何 级 数 。 由 于 无 穷 级 数 的 和 收敛 于 一 个 常数 ， 
因此 该 有 穷 级 数 也 以 一 个 常数 为 界 ， 从 而 式 (10. 10) 成 立 : 
TWN) = Ota") = O(a = OCN™*) (10. 10) 
如 果 a 王 对， 那么 和 中 的 每 一 项 均 为 1。 由 于 和 含有 1 十 log, N 项 而 “三 多 BK log, a=k, 
于 是 
T(N) = Ota" log, N) = O(GN'** log, N) = OCN* log, N) 

= O(N log N) C19. 11) 
最 后 ， 如 果 去 和， 那么 该 几何 级 数 中 的 项 都 大 于 1， 且 1.2.3 节 中 的 第 二 个 公式 成 立 。 我 
们 得 到 


» GO /a)"! —] 
(5 /a) —1 


定理 的 最 后 一 种 情形 得 证 。 

举 一 个 例子 ， 归 并 排序 有 a=b=2 H A 王 1。 第 二 种 情形 成 立 ， 因 此 答案 为 O(N log N). 
如 果 我 们 求解 三 个 问题 ， 每 个 问题 都 是 原始 大 小 的 一 半 ， 使 用 OCN) 的 附加 工作 将 解 联 合 起 
3k. Wa=3, b—2 而 有 二 1。 此 处 第 一 种 情形 成 立 ， 于 是 得 到 界 O(N"™) 二 O(N"”*”)。 求 解 


TON) =a = Ota" (b*/a)”") = OCO*)") = OCN*) (10. 12) 
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三 个 一 半 大 小 的 问题 但 需要 OCN ) 工 作 以 合并 解 的 算法 将 需要 OCN? ) 的 运行 时 间 ， 因 为 此 
时 第 三 种 情形 成 立 。 
有 两 个 重要 的 情形 定理 10.6 没有 包括 。 我 们 再 叙述 两 个 定理 ， 但 把 证 明 留 作 练习 。 定 
理 10.7 推广 了 前 面 的 定理 。 
定理 10.7 Z4 TOND —aTCON/D) 4- 8C N* log? N) 的 解 为 
OC Nes ) #a>b 
TUN) =4OCN* log"? N) dXa-—P 
O(N lo? N) ac 
HP all, 51H pmo, 


k k 
定理 10.8 wR Da <1, WHA TON) = MY TGND HON) 的 解 为 T(N) 二 OCN)。 
i=l i=] 


10.2.2 最近 点 问题 


9 — ^r Ih] AE FI 4 A Ze P i] ER ex 9 P. WIR pi 6n yi) HI po Gs y. 3A p 和 
po 间 的 欧 几 里 得 距离 为 [(z 7207 Cy yo)? 7. RATE BE X HOME HE. AT E 
两 个 点 位 于 相同 的 位 置 ; 在 这 种 情形 下 这 两 个 点 就 是 最 近 的 ， 它 们 的 距离 为 零 。 

如 果 存 在 N 个 点 ,那么 就 存在 N(N 一 1)/2 对 点 间 的 距离 。 我 们 可 以 检查 所 有 这 些 距 
离 ， 得 到 一 个 很 短 的 程序 ， 不 过 这 是 一 个 花费 OCN ) 的 算法 。 由 于 这 种 方法 是 一 种 详尽 的 
搜索 ， 因 此 我 们 应 该 期 望 做 得 更 好 一 些 。 

假设 平面 上 这 些 点 已 经 按照 x 的 坐标 排 过 序 ， 最 差 也 只 不 过 在 最 后 的 时 间 界 上 仅 多 加 
了 O(N log N) 而 已 。 由 于 将 证 明 整 个 算法 的 OCN log N) 界 ， 因 此 从 复杂 度 的 观点 来 看 ， 
该 排序 基本 上 没 增加 时 间 消 耗 的 级 别 。 

图 10-29 夯 出 一 个 小 的 样本 点 集 P。 既 然 这 些 点 已 按 x 坐标 排序 ， 那 么 我 们 就 可 以 画 一 
条 想像 的 垂 线 ， 把 点 集 分 成 两 半 : P, 和 Ps。 这 做 起 来 当然 简单 。 现 在 我 们 得 到 的 情形 几 
平和 在 2.4. 3 节 的 最 大 子 序列 和 问题 中 见 过 的 情形 完全 相同 。 最 近 的 一 对 点 或 者 都 在 Pi 
中 ,或 者 都 在 Pr 中 ,或 者 一 个 在 Pi 中 而 另 一 个 在 Pe 中 。 让 我 们 把 这 三 个 距离 分 别 叫 作 
di、dr flde. FE 10-30 显示 出 点 集 的 分 化 和 这 三 个 距离 。 
d; Eh 


oOo =c 





图 10-29 一 个 小 规模 的 点 集 10-30 被 分 成 P, 和 Pa 的 点 集 P， 图 中 显示 了 最 短 的 距离 
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我 们 可 以 递归 地 计算 dr 和 dx。 本 问题 此 时 就 是 计算 dsc。 由 于 我 们 想 要 一 个 O(N log ND 
的 解 ， 因 此 我 们 必须 能 够 仅仅 多 花 O(N) 的 附加 工作 计算 出 dec。 我 们 已 经 看 到 ， 如 果 一 个 








过 程 由 两 个 一 半 大 小 的 递归 调用 和 附加 的 ; è 
OCN) 工 作 组 成 , 那么 总 的 时 间 将 是 
O(N log N). d, "I 

4 àó—min(d,, de). 8& — P WEB | | 
论 是 ， 如 果 dc 对 8 有 所 改进 ， 那 么 我 们 mel aa 
只 需 计 算 dd 。 如 果 de 是 这 样 的 距离 ， 则 P 
定义 dc 的 两 个 点 必然 在 分 割 线 的 6 距离 Ps 
之 内 ; 我 们 将 把 这 个 区 域 叫 作 一 条 带 A 
(strip)。 如 图 10-31 所 示 ， 这 个 观察 结果 ee 
限制 了 需要 考虑 的 点 的 个 数 ( 此 例 中 的 


图 10-31 双 道 带 区 域 ， 包 含 对 于 do 带 
0 一 de)。 所 考虑 的 全 部 点 
有 两 种 方法 可 以 用 来 计算 dc 。 对 于 均 
匀 分 布 的 大 型 点 集 ， 预 计 位 于 该 带 中 的 点 | | 
的 个 数 是 非常 少 的 事实 上 ， 容易 论证 平 /* Points are all in the strip */ 





for( i = 0; i « NumPointsInStrip; i++ ) 


均 只 有 OCVN) 个 点 是 在 这 个 带 中 。 因 此 ， for( j = i 1; j < NumPointsInStrip; j++ ) 
ifC Dist(P;,P;) < 6 ) ^ | 
我 们 可 以 以 OCN) 时 间 对 这 些 点 进行 宣 力 5 = Dist(P;, Pj); | 





ses] , : Ago 
) | 计算。 图 10-32 中 的 伪 代 码 实现 该 方法 ， 
图 10-32 min(5，dc) 的 蛮 力 计算 


370) 其 中 按照 C 语言 的 约定 ， 点 的 下 标 从 0 
开始 。 

在 最 坏 情 形 下 ， 所 有 的 点 可 能 都 在 这 条 带 状 区 域内 ， 因 此 这 种 方法 不 总 能 以 线性 时 间 
运行 。 我 们 可 以 用 下 列 的 观察 结果 改进 这 个 算法 : 确定 dc 的 两 个 点 的 y 坐标 差别 最 多 是 6。 
否则 ，dc 盖 8。 设 带 中 的 点 按照 它们 的 y 坐标 排序 。 因 此 ， 如 果 p. 和 pj; 的 y 坐标 相差 大 于 
8， 那么 我 们 可 以 继续 处 理 p;,, 。 这 个 简单 的 修改 在 图 10-33 中 实现 。 





/* Points are all in the strip and sorted by y coordinate */ 


for( i = 0; i < NumPointsInStrip; i++ ) 
for( j = i + 1; j < NumPointsInStrip; j++ ) 
if( P, and P,'s coordinates differ by more than à ) 


break; /* Go to next P;. */ 
else 
TFC Dis(P,Pj < 6 ) 

6 = Dist(P;, Pj); 











图 10-33 min(5，dc) 的 精炼 计算 


这 个 附加 的 测试 对 运行 时 间 有 着 显著 的 影响 ， 因 为 对 于 每 一 个 p;, TE p, Alp; AY y ^5 
标 相差 大 于 6 并 被 迫 退 出 内 层 for 循环 以 前 ， 只 有 少数 的 点 p, 被 考察 。 例 如 ， 图 10-34 © 
示 对 于 点 ps 只 有 两 个 点 p. 和 op. 落 在 垂直 距离 在 $ 之 内 的 带 状 区 域 中 。 

对 于 任意 的 点 p;， 在 最 坏 的 情形 下 最 多 考虑 7 个 点 p;。 这 是 因为 这 些 点 必定 落 在 该 带 
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状 区 域 左 半 部 分 的 8SX8 方块 内 或 者 落 在 该 带 状 区 域 右 半 部 分 的 68X65 方块 内 。 男 一 方面 ,在 
每 个 8X6 方 块 内 的 所 有 的 点 至 少 分 离 6。 在 最 














坏 的 情形 下 ， 每 个 方块 包含 4 个 点 ， 每 个 角 上 

一 个 点 。 这 此 点 中 有 一 个 慧 坟 + REXERT a | 7 n7 

个 点 要 考虑 。 最 坏 的 情形 见 图 10-35。 注 意 ， 

虽然 ps 和 pre 有 相同 的 坐标 ， 但 它们 可 以 是 ; 5 

不 同 的 点 。 对 于 实际 的 分 析 来 说 ， 唯 一 重要 的 dy 

FLAX 2a. 的 矩形 区 域 中 的 点 的 个 数 为 O(1)， * eens 

这 当然 很 清楚 。 py 
因为 对 于 每 个 p 最 多 有 7 个 点 要 考虑 ， Sa S MES. 

所 以 计算 比 8 好 的 de 的 时 间 是 O(N)。 因 此 ， 


图 10-34 在 第 二 个 for 循环 内 只 考虑 了 
基于 两 个 一 半 大 小 的 递归 调用 加 上 联合 两 个 结 p. 和 ps 


果 的 线性 附加 工作 ， 看 来 我 们 似乎 对 最 近 点 问 
题 有 一 个 O(N log N) 解 。 然 而 ， 我 们 还 没有 pu 
直 正 得 到 O(N log N) 的 解 。 , 
问题 在 于 ， 我 们 已 经 假设 这 些 点 按照 y 
标 排序 是 现成 的 。 如 果 对 于 每 个 递归 调用 都 执 
行 这 种 排序 ， 那 么 我 们 又 有 ON log N) 的 附 | 
加 工作 : 这 就 得 到 一 个 OCN log? N) 算 法 。 不 
过 问题 还 不 全 这 么 糟 ， 尤其 在 和 蛮 力 O(N?) 


P12 PRI DR2 














TN 
算法 比较 的 时 候 。 然 而 ， 不 难 把 对 于 每 个 递归 op, PA :PR3 PR4 
调用 的 工作 简化 到 OCN)， 从 而 保证 O(N log gigas 最 多 有 8 个 点 在 该 矩形 中 ;有 两 个 
N) 算 法 。 坐标 ， 每 个 都 由 两 个 点 分 享 


我 们 将 保留 两 个 表 。 一 个 是 按照 x 坐标 排 
序 的 点 的 表 ， 而 另 一 个 是 按照 y 坐标 排序 的 点 的 表 。 我 们 分 别称 这 两 个 表 为 P 和 Q。 这 两 个 
表 可 以 通过 一 个 预 处 理 排序 步 又 花费 O(N log N) 得 到 ， 因 此 并 不 影响 时 间 界 。P 和 Qi 是 传 
北 给 左 半 部 分 递归 调用 的 参数 表 ，Prk A Qr 是 传递 给 右 半 部 分 递归 调用 的 参数 表 。 我 们 已 
经 看 到 ,PP 很 容易 在 中 间 分 开 。 一 旦 分 割 线 已 知 ， 我们 依 序 转 到 Q， 把 每 一 个 元 素 放 入 相 
应 的 Qu 或 Qk。 容 易 看 出 ，Q 和 Qex 将 自动 地 按照 y 坐标 排序 。 当 递归 调用 返回 时 ， 我 们 
扫描 Q 表 并 删除 其 x 坐标 不 在 带 内 的 所 有 的 点 。 此 时 Q 只 含有 带 中 的 点 ， 而 这 些 点 保证 是 
按照 它们 的 y 坐标 排序 的 。 

这 种 策略 保证 整个 算法 是 ON log N) 的 ， 因 为 只 执行 了 OCN) 的 附加 工作 。 


10.2.3 选择 问题 


选择 问题 (selection problem) 要 求 我 们 找 出 含 NN 个 元 素 的 表 S 中 的 第 & 个 最 小 的 元 素 。 
我 们 对 找 出 中 间 元 素 的 特殊 情况 有 着 特别 的 兴趣 ， 这 种 情况 发 生 在 &— [ N/2 1 的 时 候 。 
在 第 1 章 、 第 6 章 和 第 7 章 我 们 已 经 看 到 过 选择 问题 的 几 个 解法 。 第 7 章 中 的 解法 用 
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到 快速 排序 的 变 体 并 以 平均 时 间 O(N) 运 行 。 EKE, CE Hoare 论述 快速 排序 的 原始 论 
文中 已 有 描述 。 

虽然 这 个 算法 以 线性 平均 时 间 运 行 ， 但 是 它 有 一 个 ON ) 的 最 坏 情况 。 通 过 把 元 素 排 
FR. 选择 可 以 容易 地 以 O(N log N) 最 坏 情 形 时 间 解 决 ， 不过， 长 期 不 知道 选择 是 否 能 够 以 
O(N) 最 坏 情 形 时 间 完 成 。 在 7.7.6 节 概 述 的 快速 选择 算法 在 实践 中 是 相当 有 效 的 ， 因 此 这 
个 问题 主要 还 是 理论 上 的 问题 。 

我 们 知道 ， 基 本 的 算法 是 简单 递归 策略 。 设 N 大 于 截止 点 (cutoff point)， 在 截止 点 后 元 
素 将 进行 简单 的 排序 ，w 是 选 出 的 一 个 元 素 ， 叫 作 枢 纽 元 (pivot)。 其 余 的 元 素 被 放 在 两 个 集合 
S, AS. P. S, 含有 那些 不 大 于 wv 的 元 素 ， 而 S. 则 包含 那些 不 小 于 v 的 元 素 。 最 后 ， 如 果 
k<|S | 那么 S 中 的 第 & 个 最 小 的 元 素 可 以 通过 递归 地 计算 S, 中 第 & 个 最 小 的 元 素 而 找到 。 
如 果 k=|S | 十 1， 则 枢纽 元 就 是 第 & 个 最 小 的 元 素 。 否 则 , AES 中 的 第 & 个 最 小 的 元 素 是 
S, 中 的 第 (4 一 |Si | 一 1) 个 最 小 元 素 。 这 个 算法 和 快速 排序 之 间 的 主要 区 别 在 于 ， 这 里 要 求 
解 的 只 有 一 个 子 问 题 而 不 是 两 个 子 问题 。 

为 了 得 到 一 个 线性 算法 ， 我 们 必须 保证 子 问题 只 是 原 问 题 的 一 部 分 ， 而 不 仅仅 只 是 比 
原 问 题 少 几 个 元 素 。 当 然 ， 如 果 我 们 愿意 花费 一 些 时 间 查 找 的 话 ， 那 么 总 能 找到 这 样 一 个 
元 素 。 困 难 在 于 我 们 不 能 花费 太 多 的 时 间 寻 找 枢 纽 元 。 

对 于 快速 排序 ， 我 们 看 到 枢纽 元 一 种 好 的 选择 是 选取 三 个 元 素 并 取 它 们 的 中 项 。 这 就 
产生 某 种 枢纽 元 不 太 坏 的 期 望 ， 但 它 并 不 提供 一 种 保证 。 我 们 可 以 随机 选取 21 个 元 素 ， 以 
常数 时 间 将 它们 排序 ， 用 第 11 个 最 大 的 元 素 作 为 枢纽 元 ， 并 得 到 可 能 更 好 的 枢纽 元 。 然 
而 ， 如 果 这 21 个 元 素 是 21 个 最 大 元 ,那么 枢纽 元 仍然 不 好 。 将 这 种 想法 扩展 ， 我们 可 以 
使 用 直到 O(N/ log NN) 个 元 素 ， 用 堆 排 序 以 OCN) 总 时 间 将 它们 排序 ， 从 统计 的 观点 看 几乎 
肯定 得 到 一 个 好 的 枢纽 元 。 不 过 ， 在 最 坏 情形 下 ， 这 种 方法 行 不 通 ， 因 为 我 们 可 能 选择 
OCN/ log N) 个 最 大 的 元 素 ， 而 此 时 的 枢纽 元 则 是 第 LN 一 OCNVlog N)j 个 最 大 的 元 素 ， 这 
不 是 N 的 一 个 常数 部 分 。 

然而 ， 基 本 想法 还 是 有 用 的 。 的 确 ， 我 们 将 看 到 ， 可 以 用 它 来 改进 快速 选择 所 进行 的 
比较 的 期 望 次 数 。 但 是 ， 为 得 到 一 个 好 的 最 坏 情 形 ， 关 键 想法 是 再 用 一 个 间接 层 。 我 们 不 
是 从 随机 元 素 的 样本 中 找 出 中 项 ， 而 是 从 中 项 的 样本 中 找 出 中 项 。 

基本 的 枢纽 元 选择 算法 如 下 : 

1. ÆN 个 元 素 分 成 LN/5 J. 5 个 元 素 一 组 ， 忽 略 ( 最 多 4 个 ) 剩 余 的 元 素 。 

2. 找 出 每 组 的 中 项 ， 得 到 L N/5 | 个 中 项 的 表 M, 

3. 求 出 M 的 中 项 ,将 其 作为 枢纽 元 v 返 回 。 

我 们 将 用 术语 “五 分 化 中 项 的 中 项 ”(median-of-median-of-five partitioning) 描 述 使 用 
上 面 给 出 的 枢纽 元 选择 法 则 的 快速 选择 算法 。 现 在 我 们 证 明 ,“ 五 分 化 中 项 的 中 项 ”保证 每 
个 递归 子 问题 的 大 小 最 多 是 原 问 题 的 大 约 70%。 我 们 还 要 证 明 ， 对 于 整个 选择 算法 ,枢纽 
元 可 以 足够 快 地 算出 ， 以 确保 OCN) 的 运行 时 间 。 

现在 让 我 们 假设 N 可 以 被 5 整除 ， 因 此 不 存在 多 余 的 元 素 。 青 设 N/5 为 奇数 ， 这样 M 
就 包含 奇数 个 元 素 。 我 们 将 要 看 到 ， 这 将 提供 某 种 对 称 性 。 因 此 为 方便 起 见 ， 我们 假设 N 
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为 10k 十 5 的 形式 。 我 们 还 要 假设 所 有 的 元 素 都 是 互 异 的 。 实 际 的 算法 必须 保证 能 够 处 理 该 
假设 不 成 立 的 情况 。 图 10-36 指出 当 N—45 时 ， 枢 纽 元 如 何 能够 选 出 。 
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10-36 ”枢纽 元 的 选择 


在 图 10-36 H, v 代表 该 算法 选 出 作为 枢纽 元 的 元 素 。 由 于 v 是 9 个 元 素 的 中 项 ， 而 我 
们 假设 所 有 元 素 互 异 ， 因 此 必然 存在 4 个 中 项 大 于 wv 以 及 4 个 小 于 wv。 我 们 分 别 用 LL 和 S X 
示 这 些 中 项 。 考 虑 具有 一 个 大 中 项 (L 型 ) 的 五 元 素 组 。 该 组 的 中 项 小 于 组 中 的 另 两 个 元 素 
上 且 大 于 组 中 的 另 两 个 元 素 。 我 们 将 令 日 代表 那些 巨型 元 素 。 存 在 一 些 已 知 大 于 一 个 大 中 项 
的 元 素 。 类 似 地 ，T 代 表 那 些小 于 一 个 小 中 项 的 元 素 。 存 在 10 个 H 型 的 元 素 : HA L 型 
中 项 的 每 组 中 有 两 个 , 所 在 的 组 中 有 两 个 。 类 似 地 ， 存 在 10 个 工 型 元 素 。 

L 型 元 素 或 H 型 元 素 保 证 大 于 v， 而 S 型 元 素 或 工 型 元 素 保证 小 于 v。 于 是 ， 在 我 们 
的 问题 中 保证 有 14 个 大 元 素 和 14 个 小 元 素 。 因 此 ， 递 归 调 用 最 多 可 以 对 45—14—1-—30 
个 元 素 进行 。 

让 我 们 把 分 析 推 广 到 对 形 如 10& 十 5 的 一 般 的 N 的 情形 。 在 这 种 情况 下 ， 存 在 & 个 工 
型 元 素 和 SS 型 元 素 。 存 在 2k 十 2 个 互 型 元 素 ， 还 有 25-278 工 型 元 素 。 因 此 ， 有 3k+ 
2 个 元 素 保 证 大 于 wv 以 及 3k 十 2 个 元 素 保证 小 于 v。 于 是 在 这 种 情况 下 递归 调用 最 多 可 以 包 
含 7k 十 2 二 0. 7N SICK. WE N 不 是 10k 十 5 的 形式 ， 类 似 的 论证 仍 可 进行 而 不 影响 基本 
结果 。 

剩 下 的 问题 是 确定 得 到 枢纽 元 的 运行 时 间 的 界 。 有 两 个 基本 的 步 又。 我 们 可 以 以 常数 
时 间 找 到 5 元 素 的 中 项 。 例 如 ， 不 难 用 8 次 比较 将 5 个 元 素 排序 。 我 们 必须 进行 L N/5 JK 
这 样 的 运算 ， 因 此 这 一 步 花 费 OCN) 时 间 。 然 后 我 们 必须 计算 | N/5 元 素 组 的 中 项 。 明 显 
的 做 法 是 将 该 组 排序 并 返回 中 间 的 元 素 。 但 这 需要 花费 OQ N/5 J logl N/5 p =OCN log N) 
的 时 间 ， 因 此 不 能 这 么 做 。 解 决 方法 是 对 这 | N/5 」 个 元 素 递 归 调 用 选择 算法 。 

现在 对 基本 算法 的 描述 已 经 完成 。 如 果 想 有 一 个 实际 的 实现 方法 ,那么 还 有 某 些 细 节 
仍然 需要 填补 。 例 如 ， 重 复元 必须 要 正确 地 处 理 ， 该 算法 需要 截止 点 足够 大 以 确保 递归 调 
用 能 够 进行 。 由 于 涉及 相当 大 量 的 系统 开销 ， 而 且 该 算法 根本 不 实用 ， 因 此 我 们 将 不 再 描 
述 任何 细节 。 即 使 如 此 ， 该 算法 从 理论 的 角度 来 看 仍然 是 一 种 突破 ， 因 为 其 运行 时 间 在 最 
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坏 情形 下 是 线性 的 ， 正 如 下 面 的 定理 所 述 。 

定理 10.9 使 用 “五 分 化 中 项 的 中 项 ”的 快速 选择 算法 的 运行 时 间 为 O(N)。 

AA: 该 算法 由 大 小 为 0.7N 和 0.2N 的 两 个 递归 调用 以 及 线性 附加 工作 组 成 。 根 据 定 
理 10.8， 其 运行 时 间 是 线性 的 。 

降低 比较 的 平均 次 数 

分 治 算法 还 可 以 用 来 降低 选择 算法 预计 所 需要 的 比较 次 数 。 让 我 们 看 一 个 具体 的 例子 。 
WA 1000 个 数 的 集合 S 并 且 要 寻找 其 中 第 100 个 最 小 的 数 X。 我 们 选择 STES. Ch 
100 个 数组 成 。 我 们 期 望 X 的 值 在 大 小 上 类 似 于 S 的 第 10 个 最 小 的 数 。 尤 其 是 S 的 第 5 个 
最 小 的 数 几乎 肯定 小 于 X， 而 S 的 第 15 个 最 小 的 数 几乎 肯定 大 于 X. 

更 一 般 地 ， 从 N 个 元 素 选取 s 个 元 素 的 样本 S., So 是 某 个 数 ， 后 面 我 们 将 选择 它 使 得 
把 该 过 程 所 用 的 平均 比较 次 数 最 小 化 。 我 们 找 出 S 中 第 (vw = hs / N — 00 AS Co, = hs/ N 十 6) 
个 最 小 的 元 素 。 几 乎 可 以 肯定 S 中 的 第 k 个 最 小 元 素 将 落 在 w 和 w 之 间 ， 因 此 留 给 我 们 的 
是 关于 26 个 元 素 的 选择 问题 。 第 & 个 最 小 元 素 不 落 在 这 个 范围 内 的 概率 很 低 ， 而 我 们 有 大 
量 的 工作 要 做 。 不 过 ， 只 要 s 和 6 选择 得 好 ， 根 据 概率 论 的 定律 我 们 可 以 肯定 ， 第 二 种 情形 
对 于 整体 工作 不 会 有 不 利 的 影响 。 

如 果 进 行 分 析 ， oe m N'? log’? N 18 — N'? log N， 则 期 望 的 
比较 次 数 为 N+R+OCN*® log? N) ， 除 低 次 项 外 它 是 最 优 的 。( 如 果 &>N/2， 那 么 我 们 可 
io eck RU RI a 

大 部 分 的 分 析 都 容易 进行 。 最 后 一 项 代表 进行 两 次 选择 以 确定 v All v. 的 代价 。 假 设 采 
用 合理 聪明 的 策略 ， 则 划分 的 平均 代价 等 于 N 加 上 w; TE S 中 的 期 望 阶 (expected rank), Bil 
N 十 k 十 O(N6/s)。 如 果 第 个 元 素 在 S' 中 出 现 ， 那 么 结束 算法 的 代价 等 于 对 SS ut f EFE DU 
代价 ， 即 OC(s)。 如 果 第 个 最 小 元 素 不 在 S PHA, PARARE ON). Rm. s 和 6 已 
经 被 选取 以 保证 这 种 情况 以 非常 低 的 概率 o(1/N) 发 生 ， 因 此 该 可 能 性 的 期 望 代价 是 o), 
它 当 ON 越 来 越 大 时 趋向 于 0。 一 种 精确 的 计算 留 作 练习 10. 21。 

这 个 分 析 指 出 ， 找 出 中 项 平均 大 约 需要 1. 5N 次 比较 。 当 然 ， 该 算法 为 计算 ; 需要 浮 点 
运算 ， 这 在 一 些 机 器 上 可 能 使 该 算法 减 慢 速度 。 不 过 即使 是 这 样 ， 经 验 已 经 证 明 ， 若 能 正 
确实 现 ， 则 该 算法 完全 能 够 比 得 上 第 7 章 中 快速 选择 实现 方法 。 


10. 2.4 一 些 运算 问题 的 理论 改进 


ee 我 们 前 面 的 计算 模型 
假设 乘法 是 以 常数 时 间 完 成 ， 因 为 乘 数 很 小 。 对 于 大 的 数 ， 这 个 假设 不 再 有 效 。 如 果 我 们 
以 乘 数 的 大 小 来 衡量 乘法 ， cenis DRE Rasa RON OE i donc 
(subquadratic) 时 间 运 行 。 我 们 还 介绍 经 典 的 分 治 算法 ， 它 以 亚 立方 时 间 将 两 个 NXN 矩阵 
HR. 

整数 相 乘 

设 我 们 想 要 将 两 个 N 位 数 X 和 Y FARE. WR X 和 工 恰好 有 一 个 是 负 的 ， 那 么 结果 就 
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是 负 的 ; 否则 结果 为 正 数 。 因 此 ， 我 们 可 以 进行 这 种 检查 然后 假设 X，Y 宇 0。 几 平 每 一 个 
人 在 手 算 乘法 时 使 用 的 算法 都 需要 BCN? ) 次 操作 ， 这 是 因为 X 中 的 每 一 位 数字 都 要 被 了 的 
每 一 位 数字 去 乘 的 缘故 。 
如 果 X=61 438 521 ifj Y=94 736 407， 那 么 XY=5 820 464 730 934 047。 让 我 们 把 X 和 
Y 拆 成 两 半 ， 分 别 由 最 高 几 位 和 最 低 几 位 数字 组 成 。 此 时 ，X =6 143, Xp=8 521, Y, — 
9473, Ys —6 407。 我 们 还 有 X=X_,10'+ Xa WR Y —Y,10! --Ya, HBS 
XY = X,Y,10* + (XiYe + X,Y,)10* + XeYr 
注意 ， 这 个 方程 由 4 次 乘法 组 成 ， 即 XLYL. X,QYa. XRY, MXRYr El—-TME 
原 问 题 大 小 的 一 半 (N/2 数字 )。 用 10° 和 10' 作 乘 法 实际 就 是 添加 一 些 0， 这 及 其 后 的 几 次 
加 法 只 是 添加 了 OCN) 的 附加 工作 。 如 果 我 们 递归 地 使 用 该 算法 进行 这 4 项 乘法 ， 在 一 个 适 
当 的 基本 情形 下 停止 ， 那 么 我 们 得 到 递归 
T(N) = 4T(N/2) + O(N) 
从 定理 10.6 看 到 ，T(N) 二 OLN?*)， 因 此 很 不 幸 我 们 没有 改进 这 个 算法 。 为 了 得 到 一 
个 亚 二 次 的 算法 ， 我们 必须 使 用 少 于 4 次 的 递归 调用 。 关 键 的 观察 结果 是 
X Yet X«Y, = (Xi = 
于 是 ， 我 们 不 用 两 次 乘法 来 计算 10' 的 系数 ， 而 可 以 用 一 次 乘法 再 加 上 已 经 完成 的 两 
次 乘法 的 结果 。 图 10-37 演示 如 何 只 需求 解 3 次 递归 子 问题 。 















































— = = 
功能 值 计算 复杂 度 | 
X 6 143 赋值 
My 8 521 赋值 
Y 9 473 赋值 
Yà 6 407 赋值 
Di = Xi — Xa -2 378 O(N) 
D2 = Ya - Yi —3 066 O(N) 
E g 
XLYL 58 192 639 T(N/2) 
Xavier 54 594 047 T(N/2) 
| DiD; 7 290 948 T(N/2) 
| Dj = DiDz+ XYL + XRYR 120 077 634 O(N) 
c= = N - 
KaYa 54 594 047 上 面 已 算出 
D310* 1 200 776 340 000 O(N) 
X,Y,10? 5 819 263 900 000 000 O(N) 
| XuiYr10* + D310+ + XRYR 5 820 464 730 934 047 O(N) | 





图 10-37 分 治 算法 的 执行 情况 


容易 看 到 现在 的 递归 方程 满足 


TON) = 3T(N/2) + O(N) 


从 而 我 们 得 到 TON) = OCN*®*) =OCN'®), ASE 


况 ， 该 情况 可 以 无 须 递归 而 解决 。 


当 两 个 数 都 是 一 位 数字 时 ， 我们 可 以 通过 查 表 进 行 乘法 ; 若 有 一 个 乘 数 为 0， 则 返回 


这 个 算法 ,我 们 必须 要 有 一 个 基准 情 
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0。 假 如 在 实践 中 要 用 这 种 算法 ， 那 么 我 们 将 选择 对 机 器 最 方便 的 情况 作为 基本 情况 。 
虽然 这 种 算法 比 标准 的 二 次 算法 有 更 好 的 渐 近 性 能 ， 但 是 它 却 很 少 使 用 ， 因 为 对 于 小 
的 N 开销 大 ， 而 对 大 的 N 甚至 还 存在 更 好 的 一 些 算法 。 这 些 算法 也 广泛 利用 了 分 治 算法 。 
矩阵 乘法 
一 个 基本 的 数值 问题 是 两 个 矩阵 的 乘法 。 图 10-38 给 出 一 个 简单 的 OCN’ ) 算 法 计算 C= 
AB， 其 中 A、B 和 C 均 为 N XN 矩阵 。 该 算法 直接 来 自 于 矩阵 乘法 的 定义 。 为 了 计算 Cj 
我 们 计算 A 的 第 i 行 和 B 的 第 7 列 的 点 乘 。 按 照 通 常 的 惯例 ， 数 组 下 标 均 从 0 开始 。 





/* Standard matrix multiplication */ 
/* Arrays start at 0 */ 


void 
MatrixMultiply( Matrix A, Matrix B, Matrix C, int N ) 


int 1; Jr K 


+) /* Initialization */ 
j 


+ 
N; k++ ) 
re 











图 10-38 AH O(N?) EERIE 


长 期 以 来 兽 认为 矩阵 乘法 是 需要 工作 量 2CN' ) 的 。 
然而 ， 在 20 世纪 60 年 代 末 Strassen 指出 了 如 何 打破 
[378] QCN’) 的 屏障 。Strassen 算法 的 基本 想法 是 把 每 一 个 矩 10-39 把 AB=C 分 解 成 4 块 乘 法 
阵 都 分 成 4 块 ， 如 图 10-39 所 示 。 此 时 容易 证 明 
Cia = Ai Bi + Aio B; 
Ci = Ai Bi; + Ai ; Bi 
C; = A; Bii + Az B; 
C22 = A2. Bi; + Azo B; 
作为 一 个 例子 ， 为 了 进行 乘法 AB 





] 
s 2 r | " kx a | 
Ani A22}(Bri B» Cai Cul | 








A c1 = CD 
CD = N A 
c1 N a — 
a> «o “1 C» 
wore A Ci 
= Lm. oc o 
^ o Co «do 
一 A = oO 


我 们 定义 下 列 8 个 N/2XN/2 BF: 


3 4 1 6 5 66 9.3 
A, = | | Ai; = | | Bi, = | ] B,.. = | l 
l2 o x 4 5 oo d 
a. all 2 9 Lc 8 4 
A, = | | 4z,z = | ] B;.! = | | B: = | | 
4 3 5 6 S. | 4 ] 
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此 时 ， 我 们 可 以 进行 8 个 N/2XN/2 阶 和 矩阵 的 乘法 和 4 个 N/2X N/2 阶 矩 阵 的 加 法 。 这 些 
加 法 花费 OCN ) 时 间 。 如 果 递 归 地 进行 矩阵 乘法 ,那么 运行 时 间 满 足 
T(N) = 8T(N/2) + O(N?) 
从 定理 10. 6 我 们 看 到 T(N) 二 OLN?)， 因 此 我 们 没有 作出 改进 。 如 同 我 们 在 整数 乘法 
看 到 的 ， 我们 必须 把 子 问题 的 个 数 简化 到 8 个 以 下 。Strassen 使 用 了 类 似 于 整数 乘法 分 治 
算法 的 一 种 策略 并 指出 如 何 仔细 地 安排 计算 而 只 使 用 7 次 递归 调用 。 这 7 个 乘法 是 
M: = (Ai; — Az,2) (B2 + B,.,) 
M, = (Ai + Ao.2) (Bii + B2) 
M= (Aii — Ai) (Bi, + Bi) 
M, = CA, 1T Ai 22 B; 
M; = Ai, (Gy; — Baz) 
Mc AaB = B. 
M; = (Aa. + A;22Bi5 
一 旦 执行 这 些 乘 法 ， 则 最 后 答案 可 以 通过 下 列 8 次 加 法 得 到 

Cı = M, +M, — M, +M; 
Ci 一 M, +M; 
C:a = M; +M; 
C.: = M, — M, + M; — M, 

直接 验证 这 种 机 人 敏 的 安排 得 到 期 望 的 效果 。 现 在 运行 时 间 满 足 递 归 关 系 
T(N) = 7T(N/2) + O(N?) 

这 个 递归 关系 的 解 为 TO(N) 王 OCNee7) 一 OCN28 ), 

如 往常 一 样 ， 有 些 细节 需要 考虑 ， 如 当 N 不 是 2 的 需 时 的 情况 ， 不 过 还 是 有 些 根 本 性 
的 小 缺憾 。Strassen 算法 在 N 不 够 大 时 不 如 和 矩阵 直接 相 乘 。 它 也 不 能 推广 到 和 矩阵 是 稀 玻 ( 即 
含有 许多 的 0 元 素 ) 的 情况 ， 而 且 它 还 不 容易 并 行 化 。 当 用 浮 点 数 运算 时 ， 在 数值 上 它 不 如 
经 典 的 算法 稳定 。 因 此 ， 它 只 有 有 限 的 适用 性 。 然 而 ， 它 象征 着 重要 理论 的 里 程 碑 并 证 明 
了 ， 在 计算 机 科学 像 在 许多 其 他 领域 一 样 ， 即 使 一 个 问题 看 似 具 有 固有 的 复杂 性 ， 但 在 被 
证 明 以 前 却 始 终 不 可 定论 。 


ll 


10.3 动态 规划 


在 前 一 节 ， 我们 看 到 一 个 可 以 被 数学 上 递归 表示 的 问题 也 可 以 表示 成 一 个 递归 算法 ， 
在 许多 情形 下 对 朴素 的 穷 举 搜索 得 到 显著 的 性 能 改进 。 

任何 数学 递归 公式 都 可 以 直接 翻译 成 递归 算法 , 但 是 基本 现实 是 编译 器 常常 不 能 正确 
对 待 递归 算法 ,结果 导 致 低 效 的 算法 。 当 我 们 怀疑 很 可 能 是 这 种 情况 时 ， 我们 必须 再 给 编 
译 器 提供 一 些 帮助 ， 将 递归 算法 重新 写成 非 递归 算法 ， 让 后 者 把 那些 子 问题 的 答案 系统 地 
记录 在 一 个 表 内 。 利 用 这 种 方法 的 一 种 技巧 叫 作 动态 规划 (dynamic programming) 。 
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10.3.1 用 一 个 表 代 蔡 递 归 


在 第 2 章 我 们 看 到 ， 计 算 斐 波 那 契 数 的 自然 递归 程序 是 非常 低 效 的 。 回 忆 图 10-40 所 示 
的 程序 的 运行 时 间 TON WIE TC(N) 宇 TC(N 一 1) 十 TC(N 一 2)。 由 于 TONE A BE OE Ri 
足 同样 的 递归 关系 并 具有 同样 的 初始 条 件 ， 因 此 ， 事 实 上 T(CN) 是 以 与 斐 波 那 契 数 相 同 的 
速度 在 增长 从 而 是 指数 级 的 。 





/* Compute Fibonacci numbers as discussed in Chapter 1 */ 


int 
Fib( int N ) 


return Fib( N - 1) + Fib( N - 2 ); 





图 10-40 计算 斐 波 那 契 数 的 低 效 算 法 


另 一 方面 ， 由 于 计算 Fy 所 需要 的 只 是 Fy 和 “一 一 — 
Fw-*， 因 此 我 们 只 需要 记录 最 近 算出 的 两 个 斐 波 那 | Pbonaccid int N ) 








REL. 这 导致 图 10-41 中 的 O(N) 算 法 。 | i int 1, Last, — Answer; 
递归 算法 如 此 慢 的 原因 在 于 算法 模仿 了 递归 。 iFCN 1) 

为 了 计算 F、， 存 在 一 个 对 Fv_1 和 Fn_; 的 调用 。 然 return 1; 

而 ， 由 于 Fw ,递归 地 对 Py Al Fy HEAT, D reg 

此 存在 两 个 单独 的 计算 Fv, 的 调用 。 如 果 探 试 整个 er 

算法 ， 那 么 我 们 可 以 发 现 Fy-_; 计 算 了 3 次 ，Fn-_i 计 oy et 

BT 51x. 而 Fy_; 则 是 8 次， 等 等 。 如 图 10-42 所 } 

示 ， 元 余 计 算 的 增长 是 爆炸 性 的 。 如 果 编 译 器 的 递 REN TISNER 


} 








归 模 拟 算法 要 是 能 够 保留 一 个 预先 算出 的 值 的 表 而 
对 已 经 解 过 的 子 问题 不 再 进行 递归 调用 ， 那 么 这 种 图 10-41 计算 斐 波 那 契 数 的 线性 算法 
指数 式 的 爆炸 增长 就 可 以 避免 。 这 就 是 为 什么 图 10-41 中 的 程序 如 此 有 效 的 原因 。 


F6 





图 10-42 ”跟踪 斐 波 那 契 数 的 递归 计算 


作为 第 二 个 例子 ， 我 们 看 到 第 7 章 中 如 何 求解 递归 关系 CON) = (2/N) CU) 十 N, 其 


1 一 0 


m CO» 二 1 。 假 设 我 们 想 要 检查 所 得 到 的 解 是 否 在 数值 上 是 正确 的 ， 此 时 我 们 可 以 编写 


图 10-43 中 的 简单 程序 来 计算 这 个 递归 问题 。 

这 里 ， 递 归 调 用 又 做 了 重复 性 的 工作 。 
在 这 种 情况 下 ,运行 时 间 T(N) 满 足 
T(N) = S74 Ns 因为 如 图 10-44 所 示 ， 


1—0 


对 于 从 0 到 N—1 的 每 一 个 值 都 有 一 个 (直接 
的 ) 递 归 调 用 ， 外 加 OCN) 的 附加 工作 (除了 
图 10-44 所 示 的 树 ， 我 们 还 在 哪里 看 到 ?)。 
对 TON) 求 解 后 发 现 ， 它 的 增长 是 指数 式 的 。 
通过 使 用 一 个 表 , 我 们 得 到 图 10-45 中 的 程 
序 。 这 个 程序 避免 了 宛 余 的 递归 调用 而 以 
O(N’ ) 运 行 。 它 并 不 是 一 个 完美 的 程序 ， 作 
为 练习 ， 你 要 对 它 做 些 简单 修改 ， 把 它 的 运 
行 时 间 简 化 到 OCND 。 


"A Sa \ 


N 
CT—CO CX cl ‘co cr 


co co cr 
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double 
Eval( int N ) 
{ 


int 1; 
double Sum; 


ifC N==0) 
return 1.0; 
else 
{ 
Sum = 0.0; 
for( i = 0; i < N; i++ ) 
Sum += Eval( i ); 
return 2.0 * Sum / N + N; 











图 10-43. 计算 CCN) = (2/N) YYCG) +N 
的 值 的 递归 程序 
m C 
cx S 60 
FOX ON 
CO CO 


N N N 
CO Co C0 


10-44 ”跟踪 函数 eval 中 的 递归 计算 





double 
Eval( int N ) 
{ 


THU 1, 35 
double Sum, Answer; 
double *C; 


if( C == NULL ) 


Cl. OT 1.0; 
for( Tm 1; i <= Ns 
{ 

Sum = 0.0; 

forC j = 0; j 


) 


Answer = C[ N ]; 
free( C ); 


return Answer; 





C= malloc( sizeof( double) * (N+1) ); 


FatalError( "Out of space!!!" ); 


< i; j++) 
Sum += C[ j 1; 
C{ i J] = 2.0 * Sum/ i + 7; 








图 10-45 ”使 用 一 个 表 来 计算 C(N) 


2/N>)C(i) 十 NN 的 值 
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10.3.2 矩阵 乘法 的 顺序 安排 


设 给 定 四 个 矩阵 A、B、C 和 DD，A 的 维 数 二 50 X10，B 的 维 数 二 10X40, C 的 维 数 二 
40X30, D 的 维 数 =30X5。 虽 然 矩阵 乘法 运算 是 不 可 交换 的 ， 但 是 它 是 可 结合 的 ， 这 就 意 
味 着 和 矩阵 的 乘积 4BCD 可 以 以 任意 顺序 添加 括号 然后 再 计算 其 值 。 将 两 个 阶 数 分 别 为 pXg 
和 4%Xr 的 矩阵 显 性 相 乘 ， 使 用 par 次 标量 乘法 。( 由 于 使 用 诸如 Strassen 算法 这 样 的 理论 
上 优越 的 算法 并 没有 明显 地 改变 我 们 要 考虑 的 问题 ， 因 此 我 们 将 假设 这 个 性 能 的 界 .) 那 么 ， 
计算 ABCD 需要 执行 的 三 个 矩阵 乘法 的 最 好 方式 是 什么 ? 

在 四 个 和 矩阵 的 情况 下 ， 通 过 穷 举 搜索 求解 这 个 问题 是 简单 的 ， 因 为 只 有 五 种 方式 来 给 
乘法 排 顺序 。 我 们 对 每 种 情况 计算 如 下 : 

e (A((BC)D)): 计算 BC 需要 10 X 40 X 30— 12 000 次 乘法 。 计 算 (BO)D 的 值 需要 

12 000 次 乘法 计算 BC， 外 加 10 X 30X5=1 500 次 乘法 ， 合 计 13 500 次 乘法 。 求 
(A((BC)D)) 的 值 需 要 13 500 次 乘法 计算 (BC)D， 外 加 50X10X5=2 500 次 乘法 ， 
总 计 16 000 次 乘法 。 

e (A(B(CD))): 计算 CD 需要 40X30X5=6 000 次 乘法 。 计 算 BCCD) 的 值 需 要 6 000 
次 乘法 计算 CD, Shh 10 X40X5=2 000 次 乘法 ， 合计 8 000 次 乘法 。 求 (4(B 
(CD))) 的 值 需要 8 000 次 乘法 计算 BCCD)， 外 加 50X10X5=2 500 次 乘法 ， 总 计 
10 500 次 乘法 。 

e ((AB)(CD)): 计算 CD 需要 40X 30X 5—6 000 次 乘法 。 计 算 AB 需要 50 X 10 X 40= 
20 000 次 乘法 。 求 ((4B)(CD)) 的 值 需要 6 000 次 乘法 计算 CD，20 000 次 乘法 计算 
AB, 5M 50X40X5=10 000 次 乘法 ， 总 计 36 000 次 乘法 。 

e (((4B)C)D): 计算 AB 需要 50X10 X40= 20 000 次 乘法 。 计 算 (4B)C 的 值 需要 
20 000 次 乘法 计算 AB. FHM 50 X 40 X 30=60 000 次 乘法 ， 合 计 80 000 次 乘法 。 求 
(((4B)C)D) 的 值 需要 80 000 次 乘法 计算 (4B)C， 外 加 50x 30X 5 —7 500 次 乘法 ， 
总 计 87 500 次 乘法 。 

e ((4(BC))D): 计算 BC 需要 10 X40 X 30=12 000 次 乘法 。 计 算 A(BC) 的 值 需要 
12 000 次 乘法 计算 BC， 外 加 50 X 10 X 30=15 000 次 乘法 ,合计 27 000 次 乘法 。 求 
((A(BC))D) 的 值 需要 27 000 次 乘法 计算 4CBC) ， 外 加 50X30X5=7 500 次 乘法 ， 
总 计 34 500 次 乘法 。 

上 面 的 计算 表明 ， 最 好 的 排列 顺序 方法 大 约 只 用 了 最 坏 的 排列 顺序 方法 的 九 分 之 一 的 
乘法 次 数 。 因 此 ， 进 行 一 些 计 算 来 确定 最 优 顺序 还 是 值得 的 。 不 幸 的 是 ， 一 些 明 显 的 贪 焚 
算法 似乎 都 用 不 上 上， 而且 可 能 的 顺序 的 个 数 增长 很 快 。 设 我 们 定义 了 了 CN) 是 顺序 的 个 数 。 
此 时 ，T(1)= 二 T(2)==1，T(3)==2, 而 T(4)==5， 正 如 我 们 刚刚 看 到 的 。 一 般 地 ， 


N-1 
T(N) = >) TG)TWN— i) 
i=l 


为 此 ， 设 和 矩阵 为 Ais Á, c ÁN 且 最 后 进行 的 乘法 是 (A1A,…A;) (Aj Ain 77 AND, 此 
时 ， A TOSARA A ADHA T(N—i) ARKH SB CA AnA) 因此 ， 对 于 
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每 个 可 能 的 i， 存 在 TC) TON DAHRI CA Ap AD (Aj 4 A 5S AND s 

这 个 递归 式 的 解 是 著名 的 Catalan 数 ， 该 数 呈 指数 增长 。 因 此 ， 对 于 大 的 N， 穷 举 搜索 
所 有 可 能 的 排列 顺序 的 方法 是 不 可 行 的 。 然 而 ， 这 种 计数 方法 为 一 种 解法 提供 了 基础 ， 该 
解法 基本 上 是 优 于 指数 的 。 对 于 1 三 iN, ^c BMA, WIR. FRA Act, 否则 
和 矩阵 乘法 是 无 法 进行 的 。 我 们 将 定义 co 为 第 一 个 矩阵 A 的 行 数 。 

设 mi 是 进行 矩阵 乘法 An Anti t Areni Arn M A EREK. ADEEL, 
myaua 70. BEAR RAE Ant A) Anit Arem), HIP Lefti- Right, He at ArH 85 
乘法 次 数 为 Meeri Miti, right 十 cteicicRisht。 这 三 项 分 别 代 表 计 算 Ant A), (Aip t Aight ) 
以 及 它们 的 乘积 所 需要 的 乘法 。 

如 果 我 们 定义 Missus 为 在 最 优 排列 顺序 下 所 需要 的 乘法 次 HA. 4 Left< 
Right. BJ 

M ien. Right E min {Mieti + Miti ,Right "pif 1 CiC Right ) 


这 个 方程 意味 着 ， 如 果 我 们 有 乘法 Aunt Are IU C OE BY E HS HE PULS «— E AT RISE Asus 
A, 和 A 和 ;;1…Arian 就 不 能 次 优 地 执行 。 这 是 很 清楚 的 ， 否 则 我 们 可 以 通过 用 最 优 的 计算 代替 
次 优 计算 而 改进 整个 结果 。 

这 个 公式 可 以 直接 翻译 成 递归 程序 不过， 正如 我 们 在 最 后 一 节 看 到 的 ， 这 样 的 程序 
将 是 明显 低 效 的 。 然 而 ， 由 于 大 约 只 有 Msnaw 的 N?/2 个 值 需要 计算 ， 因此 显然 可 以 用 一 
个 表 来 存放 这 些 值 。 进 一 步 的 考察 表明 ， 如 果 Right 一 Left 二 &， 那 么 只 有 在 Miss 的 计算 
中 所 需要 的 那些 值 M,,, 满 足 y 一 + 二 k。 这 告诉 我 们 计算 这 个 表 所 需要 使 用 的 顺序 。 

如 果 除 最 后 答案 Mi.、 外 我 们 还 想 要 显示 实际 的 乘法 顺序 "那么 可 以 使 用 第 9 Serb m 
路 径 算法 的 思路 。 无 论 何 时 改变 Merno RIAR i iiit. 这 个 值 是 重要 的 。 由 此 得 
到 图 10-46 所 示 的 简单 程序 。 

虽然 本 章 重 点 不 是 编程 ， 但 是 ,我 们 还 是 要 说 ， 许 多 编程 人 员 倾 向 于 把 变量 名 称 减 缩 
成 一 个 字母 ， 这 并 没有 什么 好 处 。 可 是 这 里 <、i 和 上 却 是 作为 单字 母 变量 使 用 的 ， 这 是 因 
为 它们 与 我 们 描述 算法 所 使 用 的 名 字 是 一 致 的 ， 是 非常 数学 化 的 。 不 过 ,一 般 最 好 避免 字 
母 1 作为 变量 名 ， 因 为 “1” 非 常 像 “1"( 阿 拉 伯 数 字 )， 如 果 你 犯 了 一 个 转换 错误 ， 那 么 可 
能 会 陷入 非常 困难 的 调试 麻烦 中 。 

回 到 算法 问题 上 来 。 这 个 程序 包含 三 重 肉 套 循 环 ， 容 易 看 出 它 以 O(N’ ) 时 间 运 行 。 参 
考 文献 描述 了 一 个 更 快 的 算法 ， 但 由 于 执行 具体 矩阵 乘法 的 时 间 仍 然 很 可 能 会 比 计算 最 优 
顺序 的 乘法 的 时 间 多 得 多 ， 因 此 这 个 算法 还 是 相当 实用 的 。 


10.3.3 最 优 二 叉 查 找 树 


第 二 个 动态 规划 的 例子 考虑 下 列 输入 : 给 定 一 列 单词 wis w, cns ws 和 它们 出 现 的 
固定 的 概率 p11，p;，…，pn。 问 题 是 要 以 一 种 方法 在 一 棵 二 又 查找 树 中 安放 这 些 单词 使 得 
总 的 期 望 存 取 时 间 最 小 。 在 一 棵 二 又 查找 树 中 ,访问 深度 d 处 的 一 个 元 素 所 需要 的 比较 次 


数 是 4 十 1, 因 此 如 果 w, 被 放 在 深度 d, 上， 那么 我 们 就 要 将 Sp, + d) 极 小 化 。 


e 


302 数据 结构 与 算法 分 析 C i dbi 





/* Compute optimal ordering of matrix multiplication */ 

/* C contains number of columns for each of the N matrices */ 
/* C[ 0] is the number of rows in matrix 1 */ 

/* Minimum number of multiplications is left in ML 1 J[ N ] */ 
/* Actual ordering is computed via */ 

/* another procedure using LastChange */ 

/* M and LastChange are indexed starting at 1, instead of 0 */ 
Note: Entries below main diagonals of M and LastChange */ 
/* are meaningless and uninitialized */ 


void 
OptMatrix( const long C[ ], int N, 

TwoDimArray M, TwoDimArray LastChange ) 
{ 


Ant 1, ik, LeFE, Right; 
long ThisM; 


for( Left = 1; Left <= N; Left++ ) 
M[ Left ][ Left ] = 0; 
for( k = 1; k < N; k++ ) /* k is Right - Left */ 
for( Left = 1; Left <= N - k; Left++ ) 
{ 
/* For each position */ 
Right = Left + k; 
M[ Left ][ Right ] = Infinity; 
for( i = Left; i « Right; i++ ) 






































ThisM = M[ Left ][ i ] + M[ i+ 1 ][ Right ] 
+ C[ Left - 1] * C[ i ] * C[ Right J; 
if( ThisM < M[ Left ][ Right ] ) 
/* Update min */ 
M[ Left ][ Right ] = ThisM; 
LastChange[ Left ][ Right ] = i; 
} 
} 
} 
} 
图 10-46 找 出 矩阵 乘法 最 优 顺 序 的 程序 
作为 一 个 例子 ， 图 10-47 表示 在 某 段 课文 中 的 七 个 单词 以 ， pr 
pi 
及 它们 出 现 的 概率 。 图 10-48 显示 三 棵 可 能 的 二 又 查找 树 。 它 i | 
们 的 查找 代价 如 图 10-49 所 示 。 | 0.18 | 
第 一 棵 树 是 使 用 贪 禁 方法 形成 的 。 存 取 概 率 最 高 的 单词 被 e | es | 
if i 
HOLE ART Ae. YEE TBE Ae. OS BJ AD Mi i "E 
查找 树 。 这 两 棵 树 都 不 是 最 优 的 ， 由 第 三 棵 树 的 存在 可 以 证 | Le | 09008 | 
AE 我 们 由 此 看 到 明显 的 解法 都 是 行 不 通 的 。 图 10-47 最 优 二 叉 查 找 树 
乍 看 有 些 奇 怪 ， 因 为 问题 看 起 来 很 像 是 构造 Huffman 编码 问题 的 样本 输入 


树 ， 正 如 我 们 已 经 看 到 的 ， 它 能 够 用 贪 焚 算 法 求解 。 构 造 一 棵 最 优 二 又 查找 树 更 困难 ， 因 
为 数据 不 只 限于 出 现在 树叶 上 ， 树 还 必须 满足 二 又 查找 树 的 性 质 。 

动态 规划 解 由 两 个 观察 结论 得 到 。 再 次 假设 我 们 想 要 把 (排序 的 ) 一 些 单词 wrens 
Olei» Ctt» Wright-1， Wwright 放 到 一 棵 二 又 查 找 树 中 。 设 最 优 二 又 查找 树 以 w 作为 根 ， 其 中 
Left<i<Right。 此 时 左 子 树 必 须 包含 wi ，…，w;-1， 而 右 子 树 必须 包含 wiis ors Wri 
(根据 二 又 查 找 树 的 性 质 )。 再 有 ， 这 两 棵 子 树 还 必须 是 最 优 的 ， 因 为 否则 它们 可 以 用 最 优 
子 树 代 替 ， 这 将 给 出 关于 wi ，…，wgient 更 好 的 解 。 因 此 ， 我 们 可 以 为 最 优 二 叉 查 找 树 的 
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开销 Cerren 编写 一 个 公式 。 图 10-50 可 能 是 有 帮助 的 。 





图 10-48 对 于 上 表 中 数据 的 三 个 可 能 的 二 叉 查 找 树 














~= 
输入 BI pisa Bi #3 
单词 概率 访问 代价 访问 代价 访问 代价 
Wi bi Once Sequence Once Sequence Once Sequence 
a 0.22 2 0.44 E. 0.66 2 0.44 
am 0.18 4 0.72 2 0.36 3 0.54 
and 0.20 3 0.60 3 0.60 1 0.20 
egg 0.05 4 0.20 1 0.05 3 0.15 
if 0.25 1 0.25 3 0.75 2 0.50 
the 0.02 3 0.06 2 0.04 4 0.08 
two 0.08 Z 0.16 3 0.24 3 0.24 
总 计 1.00 2.43 2.70 2.15 























图 10-49 三 棵 二 叉 查找 树 的 比较 


qn FE .Left Right， 那 么 树 的 开 
销 是 0; 这 就 是 NULL 情形 ， 对 于 二 
又 查找 树 我 们 总 有 这 种 情形 。 和 否则 ， 
根 花 费 p;。 左 子 树 的 代价 相对 于 它 的 
BEA Cun. A TAX F E BUR BS 
代价 为 Citirsm。 如 图 10-50 所 示 ， 
这 两 棵 树 的 每 个 节点 从 w 开始 都 比 
从 它们 对 应 的 根 开 始 深 一 层 ， 因 此 ， 图 10-50 最 优 二 叉 查找 树 的 构造 








Right 


我 们 必须 加 >) p, AD) p; 。 于 是 得 到 如 下 公式 
j=Left j= 


rl Right 
Cyn = min u + Crato + Craii T X p; + 2 bi ) 
Left i< Right Td st 
Right 
= min (Cui 1 Te Cii Right ES b Pi ) 
Left<i< Right F 


j= Left 


从 这 个 方程 可 以 直接 编写 一 个 程序 来 计算 最 优 二 又 查找 树 的 价值 。 像 通常 一 样 ， 具 体 
的 查找 树 可 以 通过 存储 使 Ciun.ran: 最 小 化 的 i 值 而 保留 下 来 。 标 准 的 递归 例 程 可 以 用 来 显示 
具体 的 树 。 

图 10-51 显示 将 由 算法 产生 的 表 。 对 于 单词 的 每 个 子 区 域 ， 最 优 二 又 查找 树 的 价值 和 
根 都 被 保留 。 最 底部 的 项 计算 输入 的 全 部 单词 集合 的 最 优 二 又 查找 树 。 最 优 树 是 图 10-48 
中 所 示 的 第 三 棵 树 。 
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Left=1 Léft-2 Left=3 Left-4 ^ Left-5 ^ Left-6 Lef? 









































































xf =I a.a and.and |egg.egg | 让 .让 EZS | two..two 
35] if | .02 | the 08 [two | 
stile fae aes ES E 
本 ^ 
Ef 29 | if D [two 
a..and and..if | egg.the | if..two 
zg 
ER 80 | iol if [47] if | 
4 a..egg and..the | egg..two 
=4 
Bf 1.17| am 1.21 | and 84 | if |.57 | if 
a.if | am..the | and..two | 
=5 ae 
ER 1.83 | and 1.02) if 
a.the | 
1 n. p 
ER 1.89 | and 
i a.two | 
=} 
ER 2.15 | and 








B] 10-51 对 于 样本 输入 的 最 优 二 叉 查 找 树 的 计算 


对 于 一 个 特定 的 子 区 域 即 am. . if 的 最 优 二 叉 查 找 树 的 精确 的 计算 如 图 10-52 所 示 。 它 
是 计算 通过 在 根 处 放置 am、and、egg Al if 所 得 的 最 小 ( 价 ) 值 树 而 得 到 的 。 例 如 ， 当 and 放 
386) 在 根 处 的 时 候 ， 左 子 树 包含 am. .am( 通 过 前 面 的 计算 ， 值 为 0. 18) ， 右 子 树 包含 egg. if Cf 


real 0.35), ， 而 Pam t+ Pant Pas + Pic =0- 68， 总 价值 为 1. 21。 


N 


pea 


/ 5 AU ^ 
EN andis, /Ám.amN, / e \ 





0 + 0.80 + 0.68 = 1.48 0.18 + 0.35 + 0.68 = 1.21 
(egg ‘if ) } 
pet AN ae 
0.56 + 0.25 + 0.68 = 1.49 0.66 + 0 + 0.68 = 1.34 


图 10-52 对 am. .if 的 表 项 (1.21，and) 的 计算 


这 个 算法 的 运行 时 间 是 OCN )， 因 为 当 它 实 现时 ， 我 们 得 到 一 个 三 重 循环 。 对 于 这 个 
问题 的 一 种 OCN ) 算 法 在 一 些 练习 中 进行 了 概述 。 


10.3.4 所 有 点 对 最 短路 径 


我 们 的 第 三 个 也 是 最 后 一 个 动态 规划 应 用 是 计算 有 向 图 G 二 (V,，E) 中 每 一 点 对 间 赋 权 
最 短路 径 的 一 个 算法 。 在 第 9 章 我 们 看 到 单 发 点 最 短路 径 问 题 的 一 个 算法 ， 该 算法 找 出 从 
任意 一 点 s 到 所 有 其 他 顶点 的 最 短路 径 。 这 个 算法 (Dijkstra) 对 稠密 的 图 以 O(|Y| ) 时 间 运 
行 ， 但 是 实际 上 对 稀 玻 的 图 更 快 。 我 们 将 给 出 一 个 短小 的 算法 解决 对 稠密 图 的 所 有 点 对 的 
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问题 。 这 个 算法 的 运行 时 间 为 OV), ERREX Dijkstra 算法 | V | GE 4X8 — fb Wi VE vk 
TO 原因 是 它 的 循环 更 紧凑 。 如 果 存 在 一 些 负 的 边 值 但 没有 负 
值 圈 ， 那 么 这 个 算法 也 能 正确 运行 ; 而 Dijkstra 算法 此 时 是 失败 的 。 


ee Dijkstra 算法 的 一 些 重要 细节 (读者 可 以 复习 9.3 W). Dijkstra 算法 在 顶点 s 


始 并 分 阶段 工作 。 图 中 的 每 个 顶点 最 终 都 要 被 选 作 中 间 顶 点 。 如 果 当 前 所 选 的 项 点 是 v， 那 
么 对 于 每 个 wEV， 置 4d 一 min(4d,，d, 十 c,，w)。 这 个 公式 是 说 ，( 从 3] w 的 最 佳 距离 或 者 
是 前 面 知 道 的 从 s 到 ww Pons 或 者 是 从 RT URN TREDNN V NI SV IRR. 

Dijkstra 算法 提供 了 动态 规划 算法 的 想法 : 我 们 依 序 选择 这 些 顶 点 。 我 们 将 Dy 定义 
Av, 到 w; REH vs w, roo 作为 中 间 顶 点 的 最 短路 径 的 权 。 根 据 这 个 定义 ，Do.;.; = 
cij， 其 中 若 (v;，wj) 不 是 该 图 的 边 则 c. foo, HA. REEL. Div) ij 2A PM vi 到 也 
的 最 短路 径 。 

如 图 10-53 Bray, “4 k>O 时 我 们 可 以 给 Di.i,; 写 出 一 个 简单 公式 。 从 v; |o; 只 使 用 vi， 
vo. t. vy 作为 中 间 顶 点 的 最 短路 径 或 者 是 根本 不 使 用 wv 作为 中 间 项 点 的 最 短路 径 ， 或 者 
PENSA em fI v,—v, 合并 而 成 的 最 短路 径 ， 其 中 的 每 条 路 径 只 使 用 前 & 一 1 个 顶点 
作为 中 间 顶 点 。 这 导致 下 面 的 公式 

Di; = min( Dii; De 十 De 





/* Compute All-Shortest Paths */ 

/* A[ ] contains the adjacency matrix */ 

/* with AL i ][ i ] presumed to be zero */ 

/* D[ ] contains the values of the shortest path */ 
/* N is the number of vertices */ 

/* A negative cycle exists iff */ 

/* DL i JL i ] is set to a negative value */ 

/* Actual path can be computed using Path[ ] */ 

/* All arrays are indexed starting at 0 */ 

/* NotAVertex is -1 */ 


void 

AllPairs(C TwoDimArray A, TwoDimArray D, 
TwoDimArray Path, int N ) 

{ 


30t 15 Js Kk; 
/* Initialize D and Path */ 
A 1*7 for( i = 0; i « N; i++ ) 
/* 2*/ for( j = 0; j < N; j++) 
{ 
f* 3*/ DL JL 3-] = AT 35: JL 3. 35 
/[* 4*/ Path[ i ][ j ] = NotAVertex; 
} 
J* 5*/ for( k = 0; k < N; ke ) 
/* Consider each vertex as an intermediate */ 
Je 6*7 fort i = 0; i « N; i++ ) 
/* 7*/ for( j = 0; j < N; j++) 
/* 8*/ TAC DET IE kK TD KIL Gg 1) «DL JE3 ] 2 
{ 
/* Update shortest path */ | 
J= 9*7 OC a JL 3 ] = DE : Jt k] +00 k JC 3 4; | 
/*10*/ Path[ i ][ k ] = 











10-53 所 有 点 对 最 短路 径 
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时 间 需 求 还 是 OC|Y| )。 跟 前 面 的 两 个 动态 规划 例子 不 同 ， 这 个 时 间 界 实际 上 尚未 用 另外 
的 方法 降低 。 

因为 第 k 阶段 只 依赖 于 第 (& 一 1) 阶 段 ， 所 以 看 来 具有 两 个 |V| 关 |1V| 移 阵 需要 保存 。 然 
而 ， 在 用 & 开始 或 结束 的 路 径 上 以 & 作为 中 间 顶 点 对 结果 没有 改进 ， 除 非 存 在 一 个 负 的 圈 。 
因此 只 有 一 个 矩阵 是 必需 的 ， 因 为 Dirie = Dror M Dicia = Dirjo ERE A A HKR 
不 改变 值 且 都 不 需要 存储 。 这 个 观察 结果 导致 图 10-53 中 的 简单 程序 ， 为 与 C 的 约定 一 致 ， 
该 程序 将 顶点 从 0 开始 编号 。 

在 一 个 完全 图 中 ， 每 一 对 顶点 (在 两 个 方向 上 ) 都 是 连通 的 ， 该 算法 几乎 肯定 要 比 Dijk- 
stra 算法 的 |V| 次 迭代 快 ， 因 为 这 里 的 循环 非常 紧凑 。 第 1 一 4 行 可 以 并 行 执行 ， 第 6 一 10 
行 也 可 并 行 执行 。 因 此 ， 这 个 算法 看 来 很 适合 并 行 计算 。 

动态 规划 是 强大 的 算法 设计 技巧 ， 它 给 解 提供 一 个 起 点 。 它 基本 上 是 首先 求解 一 些 更 
简单 问题 的 分 治 算法 的 范例 ， 重 要 的 区 别 在 于 这 些 更 简单 的 问题 不 是 原 问题 的 明确 的 分 割 。 
因为 反复 求解 子 问题 ， 所 以 重要 的 是 将 它们 的 解 记 录 在 一 个 表 中 而 不 是 重新 计算 它们 。 在 
某 些 情况 下 ， 解 可 以 被 改进 (虽然 这 确实 不 总 是 明显 的 且 常 常 是 困难 的 )， 而 在 另 一 些 情况 
下 ， 动 态 规划 方法 则 是 所 知道 的 最 好 的 处 理 方法 。 

在 某 种 意义 上 ， 如 果 你 看 出 一 个 动态 规划 问题 ， 那 么 你 就 看 出 所 有 的 问题 。 动 态 规划 
更 多 的 例子 在 一 些 练习 和 参考 文献 中 可 以 找到 。 


10.4 随机 化 算法 


假设 你 是 一 位 教授 ,正在 布置 每 周 的 程序 设计 作业 。 你 想 确 保 学 生 在 完成 自己 的 程序 ， 
或 至 少 理解 他 们 提交 上 来 的 程序 。 一 种 解决 方案 是 在 每 个 程序 呈 交 的 当天 进行 一 次 测验 ( 面 
iO. 。 另 一 方面 ， 这 些 测验 花费 课外 时 间 ， 因 此 实际 上 只 能 对 大 约 半数 的 程序 可 以 这 么 做 。 
你 的 问题 是 决定 什么 时 候 进 行 这 些 测验 。 

当然 ， 如 果 事 先 宣 布 这 些 测验 ， 那么 这 可 以 解释 为 对 得 不 到 测验 的 50% 程 序 的 默许 作 
闵 。 你 可 能 采取 不 宣布 的 策略 对 备 选 的 程序 进行 测验 ， 不 过 学 生 们 很 快 就 会 搞 清 楚 这 种 做 
法 。 男 一 种 可 能 是 对 看 似 重 要 的 程序 进行 测验 ， 而 这 又 会 泄露 从 学 期 到 学 期 类 似 的 测验 风 
格 。 学 生 传 播 都 考 些 什么 样 的 题 ， 这 种 策略 很 可 能 经 过 一 个 学 期 以 后 就 没有 什么 价值 了 。 

消除 这 些 商 端的 一 种 方法 是 使 用 一 个 硬币 。 测 验 对 每 一 个 程序 进行 (举行 测验 远 不 如 给 
他 们 评分 消耗 时 间 )， 在 开始 上 课时 教授 将 掷 硬币 来 决定 是 否 要 举行 测验 。 采 用 这 种 方式 ， 
在 上 课 前 不 可 能 知道 测验 是 否 要 进行 ， 而 测验 的 模式 从 学 期 到 学 期 之 间 也 不 重复 。 这 样 ， 
不 管 前 面 的 测验 都 是 什么 规律 ， 学 生 只 能 预计 测验 发 生 的 概率 将 是 50% 。 这 种 方法 的 缺点 
是 有 可 能 整个 学 期 都 没有 测验 ， 不 过 这 不 太 可 能 发 生 ， 除 非 硬币 有 问题 。 每 个 学 期 测验 的 
期 望 次 数 是 程序 数目 的 一 半 ， 并且 测 验 的 次 数 将 以 高 概率 不 会 太 偏离 这 个 数目 。 

这 个 例子 叙述 了 我 们 称 之 为 随机 化 算法 (randomized algorithm) 的 方法 。 在 算法 期 间 ， 
随机 数 至 少 有 一 次 用 于 决策 。 该 算法 的 运行 时 间 不 只 依赖 于 特定 的 输入 ， 而且 依 赖 于 所 发 
生 的 随机 数 。 
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一 个 随机 化 算法 的 最 坏 情形 运行 时 间 几 乎 总 是 和 非 随 机 化 算法 的 最 坏 情形 运行 时 间 相 
同 。 重 要 的 区 别 在 于 ， 好 的 随机 化 算法 没有 不 好 的 输入 ， 而 只 有 坏 的 随机 数 ( 相 对 于 特定 的 
输入 )。 这 看 起 来 似乎 只 是 哲学 上 的 差别 , 但 是 实际 上 它 是 相当 重要 的 ,正如 下 面 的 例子 
所 示 。 

考虑 快速 排序 的 两 种 变形 。 方 法 A 用 第 一 个 元 素 作 为 枢纽 元 ， 而 方法 B 使 用 随机 选 出 
的 元 素 作 为 枢纽 元 。 在 这 两 种 情形 下 ， 最 坏 情形 运行 时 间 都 是 8(N?* )， 因 为 在 每 一 步 都 有 
可 能 选取 最 大 的 元 素 作为 枢纽 元 。 两 种 最 坏 情形 之 间 的 区 别 在 于 ， 存 在 特定 的 输入 总 能 够 
出 现在 A 中 并 产生 不 好 的 运行 时 间 。 当 每 一 次 给 定 已 排序 数据 时 ,方法 A 都 将 以 (CN? ) 时 
间 运 行 。 如 果 方 法 B 以 相同 的 输入 运行 两 次 ,那么 它 将 有 两 个 不 同 的 运行 时 间 ， 这 依赖 于 
什么 样 的 随机 数 发 生 。 

在 运行 时 间 的 计算 中 我 们 通 篇 假设 所 有 的 输入 都 是 等 可 能 的 。 实 际 上 这 并 不 成 立 ， 例 
如 几乎 排序 的 输入 常常 要 比 统计 上 期 望 的 出 现 得 多 得 多 ， 而 这 会 产生 一 些 问 题 ， 特 别 是 对 
快速 排序 和 二 又 查找 树 。 通 过 使 用 随机 化 算法 ， 特 定 的 输入 不 再 是 重要 的 。 重 要 的 是 随机 
数 ， 我 们 可 以 得 到 一 个 期 望 的 运行 时 间 ， 此 时 我 们 是 对 所 有 可 能 的 随机 数 取 平 均 而 不 是 对 
所 有 可 能 的 输入 求 平均 。 使 用 随机 枢纽 元 的 快速 排序 算法 是 一 个 O(N log N) 期 望 时 间 算 
法 。 这 就 是 说 ， 对 任意 的 输入 ,包括 已 经 排序 的 输入 ,根据 随机 数 统计 学 理论 ， 运 行 时 间 
的 期 望 值 为 O(N log N)。 期 望 运行 时 间 界 多 少 要 强 于 平均 时 间 界 , 但是， 当然 要 比 对 应 的 
最 坏 情 形 界 弱 。 男 一 方面 ， 正 如 我 们 在 选择 问题 中 所 看 到 的 ， 得 到 最 坏 情 形 时 间 界 的 那些 
解决 方案 常常 不 如 它们 的 平均 情形 那样 在 实际 中 常见 。 但 是 ， 随 机 化 算法 却 通常 是 一 致 的 。 

在 这 一 节 ， 我们 将 考察 随机 化 的 两 个 用 途 。 首 先 ， 我 们 将 介绍 以 O(log N) 期 望 时 间 支 
持 二 又 查找 树 操 作 的 新 颖 的 方案 。 这 意味 着 不 存在 坏 的 输入 ， 只 有 坏 的 随机 数 。 从 理论 的 
观点 看 ， 这 并 没有 那么 令 人 振奋 ， 因 为 平衡 查找 树 在 最 坏 情 形 下 达到 了 这 个 界 。 然 而 ， 随 
机 化 的 使 用 导致 了 对 查找 、 插 入 、 特 别 是 删除 的 相对 简单 的 算法 。 

第 二 个 应 用 是 测试 大 数 是 否 是 素数 的 随机 化 算法 。 对 于 这 个 问题 ,没有 已 知 的 有 效 的 
多 项 式 时 间 非 随机 化 算法 。 我 们 介绍 的 这 种 算法 运行 很 快 但 偶尔 会 有 错 。 不过， 发 生 错 误 
的 概率 可 以 小 到 忽略 不 计 。 


10.4.1 随机 数 发 生 器 


由 于 我 们 的 算法 需要 随机 数 ， 因 此 我 们 必须 要 有 一 种 方法 去 生成 它 。 实 际 上 ， 真正 的 
随机 性 在 计算 机 上 是 不 可 能 的 ， 因 为 这 些 数 将 依赖 于 算法 ， 从 而 不 可 能 是 随机 的 。 一 般 说 
来 ， 产 生 伪 随机 数 (pseudorandom number) 就 足够 了 ， 伪 随机 数 是 看 起 来 像 是 随机 的 数 。 随 
机 数 有 许多 已 知 的 统计 性 质 ， 伪 随机 数 满足 这 些 性 质 的 大 部 分 。 令 人 惊奇 的 是 ， 这 说 起 来 
容易 ， 做 起 来 可 就 难 多 了 。 

设 我 们 只 需要 抛 一 枚 硬币 。 这 样 ， 我们 必然 随机 地 生成 0 或 1。 一 种 做 法 是 考察 系统 时 
钟 。 这 个 时 钟 可 以 把 时 间 记 录 成 整数 ， 而 这 个 整数 是 从 某 个 起 始 时 刻 开 始 计数 的 秒 数 。 此 
时 我 们 可 以 使 用 它 的 最 低 二 进 制 位 。 问 题 在 于 ， 如 果 需 要 随机 数 序列 ， 那 么 方法 就 不 理想 
了 。 一 秒 是 一 个 长 的 时 间 段 ， 在 程序 运行 时 这 个 时 钟 可 能 根本 没 变化 。 即 使 时 间 用 微妙 为 


307 


[393] 


308 


[394 | 


数据 结构 与 算法 分 析 C 语言 描述 


单位 记录 ， 如 果 程 序 自身 正在 运行 ， 那 么 所 生成 的 数 的 序列 也 远 不 是 随机 的 ， 因 为 在 对 发 
生 器 的 多 次 调用 之 间 的 时 间 在 每 次 程序 调用 时 可 能 都 是 一 样 的 。 此 时 我 们 看 到 ， 真 正 需要 
AY) Fe: BL Be AY Æ 9) (sequence) , © 这些 数 应 该 独立 地 出 现 。 如 果 一 枚 硬币 抛 出 后 出 现 的 是 正 
面 ， 那 么 下 一 次 再 抛 出 时 出 现 正面 或 反面 应 该 还 是 等 可 能 的 。 

产生 随机 数 的 最 简单 的 方法 是 线性 同 余 发 生 器 ， 它 于 1951 年 由 Lehmer 首先 描述 。 数 
Tis Tzs “ee RER E 

(47 Ax; mod M 

为 了 开始 这 个 序列 ， 必 须 给 出 xy api: 个 值 叫 作 种 子 (seed) 。 如 果 x =0, MAK 
个 序列 远 不 是 随机 的 ， a e. 那么 任何 其 他 的 1 <r <M 都 是 同等 有 
效 的 。 如 果 M 是 素数 ， 那 么 zx; 就 绝 不 会 是 0。 作 为 一 个 例子 ， 如 果 M=11, A=7, 而 
Xo =1, 那么 所 生成 的 数 为 

Te By 5 Be Mh 44. d.d. lo Tu By. E. ow 

注意 ， 在 M—1—10 个 数 以 后 ， 序 列 将 重复 。 因 此 ， 这 个 序列 的 周期 为 M 一 1， 它 是 尽 
可 能 地 大 (根据 钢 梨 原理 )。 如 果 M 是 素数 ,那么 总 存在 对 A 的 一 些 选择 能 够 给 出 整 周 期 
(full period)M 一 1。 对 A 的 有 些 选择 则 得 不 到 这 样 的 周期 ， 如 果 A=5 而 zo 二 1， 那 么 序列 
有 一 个 短 周期 二 5。 

本 本 

如 果 M 选择 得 很 大 ， 比 如 31 位 的 素数 ,那么 对 于 大 部 分 的 应 用 来 说 周期 应 该 是 非常 
长 的 。Lehmer 建议 使 用 31 位 的 素数 M=2"' —1—2 147 483 647。 对 于 这 个 素数 ，A= 
48 271 是 给 出 整 周 期 发 生 器 的 许多 值 中 的 一 个 。 它 的 用 途 已 经 被 深入 人 研究 并 被 这 个 领域 的 
专家 推荐 。 后 面 我 们 将 看 到 ， 对 于 随机 数 发 生 器 ， 贸 然 修改 通常 意味 着 失败 ， 因 此 我 们 奉 
劝 还 是 继续 坚持 使 用 这 个 公式 直到 有 新 的 成 果 发 布 。 

这 像 是 一 个 实现 起 来 很 简单 的 例 程 。 一 般 ， 全 
局 变量 用 来 存放 ds jenen x 这 是 全 局 变量 发 static unsigned long Seed = 1; 
挥 作用 的 罕见 情况 。 这 个 全 局 变量 由 某 个 例 程 初始 MARE 
化 。 ee ean 大 概 最 deulie 
好 是 置 xz, 二 1， 这 使 得 总 是 出 现 相同 的 随机 序列 。 当 | qanm vota) 





程序 工作 时 ,可 以 使 用 系统 时 钟 ， 也 可 以 要 求 用 户 el a Red ba 
输入 一 个 值 作为 种 子 。 


一 个 位 于 开 区 fi] CO, 1) 的 随机 实数 (0 和 1 cu NM unsigned long InitVal ) 
是 不 可 能 取 的 值 ) 也 是 常见 的 情况 ， 这 可 以 通过 除 以 | 1 auus -mmitval | 
M 得 到 。 由 此 可 知 ,， 在 任意 闭 区 间 [c， 有 由 的 随机 数 | ! 

可 以 通过 规范 化 来 计算 。 这 将 产生 图 10-54 中 “明显 

的 ” 例 程 ， 不 过 ， 该 例 程 只 在 很 少 的 机 器 上 能 够 正 


常 运行 。 








10-54 不 能 正常 工作 的 随机 数 发 生 器 





日 ”在 本 节 的 其 余部 分 我 们 将 使 用 随机 代替 伪 随 机 。 


个 例 程 的 问题 是 乘法 可 能 溢出 ; 虽然 这 不 是 一 个 错误 ， 但 是 它 影 响 计 算 的 结果 ， 从 
dus Schrage 给 出 一 个 过 程 ， 在 这 个 过 程 中 所 有 的 计算 均 可 在 32 位 机 上 进行 
而 不 会 溢出 。 我 们 计算 M/A 的 商 和 余数 并 把 它们 分 别 定义 为 QQ 和 R。 在 上 述 情况 下 ，Q= 
44 488, R=3399, R<Q, RNA 





ny Jas dp BE n M[Az: | = Ar,- M[E |-- ME |— [es | 


= As -M| |-M(lS ]- oz: |) 
HF x, =Q [+2 mod Q, 我 们 可 以 代入 到 右边 的 第 一 项 Ax, 并 得 到 
x47 A(Q[& |+ x mod Q)— «l2 |- «(I ]- Lr ]) 
— (AQ MD |= | 
但 M=AQ+R, Ait AQ 一 M= 一 R。 于 是 我 们 得 到 
ri = A(z; mod Q) 一 Riž (a J- J 


^er | aM PSE o. RIE 1， 因 为 两 项 都 是 整数 而 它们 的 差 非 0 即 1。 因 此 ， 





+ AGr, mod Q) +o (|Z |-| J 





3i &o-[SH 
我 们 有 
Ta = AU, mod 的 - R[5 |+ Moca) 


快速 验证 表明 ， 因 为 R 二 Q， 故 所 有 的 余 项 均 可 计算 而 没有 溢出 (这 就 是 选择 A = 48 271 的 
原因 之 一 ) 。 此 外 ， 仅 当 余 项 的 值 小 于 0 = 
时 ，6(z,) 二 1。 因 此 5(x,) 不 需要 显 式 地 static unsigned long Seed = 1; 
计算 而 是 可 以 通过 简单 的 测试 来 确定 。 | *define A 48271. 0 7 
这 导致 图 10-55 中 的 程序 。 A 
只 要 INT MAXZ2'!—1, x^ EI | duda 


就 能 正常 工作 。 人 们 可 能 会 想到 要 假设 rar Rises 





所 有 的 机 器 在 它们 标准 库 中 都 有 一 个 至 long TmpSeed; 
少 像 图 10-55 中 的 程序 那么 好 的 随机 数 | ede S a A 
发 生 器 ， 但 糟糕 的 是 ， 情 况 不 是 这 样 。 “a = TmpSeed; 
许多 库 中 的 发 生 器 基于 函数 Seed = TmpSeed + M; 
zai = (Ax; +O) mod 2? return ( double ) Seed / M; 


其 中 B 的 选取 要 匹配 机 器 整 数 的 位 数 ， | 、， 


而 C 是 奇数 。 这 些 库 也 返回 x;， 而 不 是 unsigned long InitVal ) 
0 和 1 之 间 的 一 个 值 。 不幸 的 是 ,这些 | Seed = Initval; 
发 生 器 总 是 产生 在 奇偶 之 间 交 错 的 z， L[- —— 


的 值 一 一 很 难 具 有 理想 的 性 质 。 事 实 图 10-55 工作 于 32 位 机 上 的 随机 数 发 生 器 
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E, (充其量 ) 是 低 k 位 以 周期 2 循环 。 许 多 其 他 随机 数 发 生 器 要 比 图 10-55 所 提供 的 随机 
数 发 生 器 的 循环 小 得 多 。 这 些 发 生 器 对 于 需要 长 的 随机 数 序列 的 情况 是 不 合适 的 。 最 后 ， 
我 们 通过 在 方程 中 添加 一 个 常数 可 能 会 得 到 更 好 的 随机 数 发 生 右 。 例 如 ， 
tai = (48 2712; + 1)mod(2" — 1) 
Be b zx UB Bi EL E., gx Aa HF 3x 96 BL CA ^E si d BE s 。 
[48 271(179 424 105) + 1]mod(2?' — 1) = 179 424 105 
Dd yt. ARR E 179424105. BBA ACHE di ME BA A Jad 1 的 循环 。 


10.4.2 跳跃 表 


随机 化 的 第 一 个 用 途 是 以 O(log N) 期 望 时 间 支 持 查 找 和 插入 的 数据 结构 。 正 如 在 本 节 
介绍 中 所 提 到 的 ， 这 意味 着 对 于 任意 输入 序列 的 每 一 次 操作 的 运行 时 间 都 有 期 望 值 O(log 
N)， 其 中 的 期 望 是 基于 随机 数 发 生 器 的 。 能 够 添加 删除 和 所 有 涉及 排序 的 操作 并 得 到 与 二 
又 查找 树 的 平均 时 间 界 匹配 的 期 望 时 间 界 。 

ile a bli ionic 图 10-56 是 一 个 简单 的 链表 。 执 行 一 
查找 的 时 间 正 比 于 必须 考察 的 节点 个 数 ， 这 个 个 数 最 多 是 N。 


H2 H4 8 [4410 [411 HH 13 [44 19 [3420 [1H 22 [+423 | {4 29 4, 























图 10-56 ”简单 链表 


图 10-57 表示 一 个 链表 ， 在 该 链表 中 ， 每 隔 一 个 节点 有 一 个 附加 的 指针 指向 它 在 表 中 
前 两 个 位 置 上 的 节点 。 因 此 ， 在 最 坏 情形 下 ， 最 多 考察 [| N/2 | 十 1 个 节点 。 


rn: fot" ca 9 OTH” amie 


图 10-57 PARMA MS 2 个 表 元 素 的 指针 的 链表 









































将 这 种 想法 扩展 ， 我 们 得 到 图 10-58。 这 里 ， 每 个 序数 是 4 的 倍数 的 节点 都 有 一 个 指针 
指向 下 一 个 序数 是 4 的 倍数 的 节点 。 只 有 [「 N/A 1] 十 2 个 节点 被 考察 。 


ia m 
| Lr pH Hr a » 23 zu» 


图 10-58 带 有 指向 前 面 第 4 个 表 元 素 的 指针 的 链表 















































这 种 跳跃 幅度 的 一 般 情 形 如 图 10-59 所 示 。 每 个 2 节点 就 有 一 个 指针 指向 下 一 个 2 节 

点 。 总 的 指针 个 数 仅 仅 是 加 倍 ， 但 现在 在 一 次 查找 中 最 多 考察 | log N 1 个 节点 。 不 难看 到 ， 

一 次 查找 总 的 时 间 消 耗 为 O(log N). 这 是 因为 查找 由 向 前 到 一 个 新 的 节点 或 者 在 同一 节点 

下 降 到 低 一 级 的 指针 组 成 。 在 一 次 查找 期 间 每 一 步 总 的 时 间 消 耗 最 多 为 O(log N)。 注 意 ， 
在 这 AE E E RT search) , 

这 种 数据 结构 的 问题 是 有 效 的 插 和 人 太 过 于 有 呆板。 使 用 这 种 数据 结构 的 关键 是 稍微 放松 
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结构 条 件 。 我 们 将 带 有 个 指针 的 节点 定义 为 & 阶 节点 (level k node), WK 10-59 所 示 ， 任 
意 & 阶 节点 上 的 第 i pie bd lech ECT nl 这 是 一 个 容易 保留 的 性 
Wi. 不 过 ,图 10-59 指出 比 它 更 有 限制 性 的 性 质 。 这 样 ， 我 们 把 第 i 个 指针 指向 前 面 第 2 
个 节点 的 这 个 限制 去 掉 ， 而 用 上 面 稍 松 一 些 的 限制 条 件 兰 代 . 
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图 10-59 带 有 指向 前 面 第 2 个 表 元 素 的 指针 的 链表 
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当 需 要 插入 新 元 素 的 时 候 ， 我们 为 它 分 配 一 个 新 的 节点 。 此 时 ,我 们 必须 决定 该 节点 
pu 考察 图 10-59 后 发 现 ， 大 约 一 半 的 节点 是 1 阶 节 点 ， 大 约 1/4 的 节点 是 2 阶 节 

， 一 般 地 ， 大 约 1/2 的 节点 是 i 阶 节点 。 我 们 按照 这 个 概率 分 布 随机 选择 节点 的 阶 数 。 
最 容易 的 方法 是 抛 一 枚 硬币 直到 正面 出 现 并 把 擅 硬 币 的 总 次 数 作为 该 节点 的 阶 数 。 图 10-60 
显示 一 个 典型 的 跳跃 表 (skip list). 


| ar | 22 2 + 
att Holt n Iovis: 


图 10-60 ”一 个 跳跃 表 


给 出 上 面 的 分 析 以 后 ， 跳 峻 表 算 法 的 描述 就 简单 了 。 为 执行 一 次 Finda， 我 们 在 头 节点 
从 最 高 阶 的 指针 开始 ， iau ic 直至 找到 大 于 我 们 正在 寻找 的 节点 的 下 一 人 
点 (或 者 是 NULL) 前 停 下 。 这 个 时 候 ， 我们 转 到 低 一 阶 的 阶 并 继续 这 种 方法 。 a 
停止 时 ， e ae 或 者 它 不 在 这 个 表 中 。 为 了 执行 一 次 In- 
sert， 我 们 像 在 执行 Find 时 那样 ， 始 终 监 视 每 一 个 使 我 们 转 到 下 一 阶 的 节点 。 最 后 ， 将 
新 节点 ( 它 的 阶 是 随机 确定 的 ) 拼 接 到 表 中 。 操 作 见 图 10-61, 
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图 10-61 插入 前 和 插入 后 的 跳跃 表 
粗略 分 析 指 出 ， 由 于 没有 在 原 ( 非 随机 化 的 ) 算 法 上 改变 每 一 阶 的 节点 的 期 望 个 数 ， 因 
此 预计 穿越 该 同 阶 的 节点 的 总 的 工作 量 是 不 变 的。 这 告诉 我 们 ， 这些 操作 具有 期 望 ( 价 ) 值 
O(log N)。 当 然 ， 更 形式 化 的 证 明 是 需要 的 ， 但 它 与 这 里 没有 太 大 的 区 别 。 
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跳跃 表 类 似 于 散 列 表 ， 它们 都 需要 估计 表 中 的 元 素 个 数 ( 从 而 阶 的 个 数 可 以 确定 )。 如 
果 得 不 到 这 种 估计 ， 那么 我 们 可 以 假设 一 个 大 的 数 或 者 使 用 一 种 类 似 于 再 散 列 (rehash) 的 
方法 。 经 验 表 明 ， 跳 跃 表 如 许多 平衡 查找 树 实现 方法 一 样 有 效 ， 当 然 ， 用 许多 种 语言 实现 
都 会 简单 得 多 。 


10.4.3 素性 测试 


在 这 一 节 ， 我 们 考察 确定 一 个 大 数 是 否 是 素数 的 问题 。 正 如 在 第 2 章 末尾 谈 到 的 ， 某 
些 密码 方案 依赖 于 大 数 分 解 的 困难 性 ， 比 如 将 一 个 200 位 数 分 解 成 两 个 100 位 的 素数 相 乘 。 
为 了 实现 这 种 方案 ,我 们 需要 一 种 生成 两 个 大 素数 的 方法 。 因 为 现在 没有 人 知道 如 何以 d 
的 多 项 式 时 间 测 试 一 个 4d 位 数字 的 数 N 是 否 是 素数 ， 所 以 分 解 大 素数 的 问题 主要 还 是 理论 


上 的 问题 。 例 如 ， 测试 能 否 被 从 3 到 VN 的 奇数 整除 的 常用 方法 大 约 需 要 专 VN 次 除法 ， E 


KAA 2., HH. SA RUA AE NP- 完 全 的 ; 因此 ， 它 是 处 在 边缘 上 的 少数 
几 个 问题 之 一 一 一 它 的 复杂 性 在 编写 本 书 时 尚 不 知道 。 

在 这 一 章 ， 我 们 将 给 出 一 个 可 以 测试 素性 的 多 项 式 时 间 算 法 。 如 果 这 个 算法 宣称 一 个 
数 不 是 素数 ， 那 么 我 们 可 以 肯定 这 个 数 不 是 素数 。 如 果 该 算法 宣称 一 个 数 是 素数 ， 那 么 ， 
这 个 数 将 以 高 的 概率 而 不 是 100% 肯 定 是 素数 。 错 误 的 概率 不 依赖 于 被 测试 的 特定 的 数 ， 而 
是 依赖 于 由 算法 做 出 的 随机 选择 。 因 此 ， 这 个 算法 偶尔 会 出 错 ， 不 过 将 会 看 到 ， 我们 可 以 
让 出 错 的 比率 任意 小 。 

算法 的 关键 是 著名 的 费 马 (Fermat) 定 理 。 

定理 10.10 RADZE: 如 果 忆 是 素数 ， 且 0 二 A 二 P， 那么 A’ '=1(mod P), 

证 明 : 这 个 定理 的 证 明 可 以 在 任意 一 本 数论 教科 书 中 找到 。 

例如 ， 由 于 67 是 素数 ， 因 此 2°=1(mod 67) 。 这 提出 了 测试 一 个 数 N 是 否 是 素数 的 算 
ik: 只 要 检验 一 下 是 否 2y '=1(mod N)。 如 果 2> 'zÉl(mod N) 成 立 ， 那 么 我 们 可 以 肯定 
N 不 是 素数 。 男 一 方面 ， 如 果 等 式 成 立 ， 那 么 N 很 可 能 是 素数 。 例 如 ， 满 足 2 '=1Cmod 
NN) 但 不 是 素数 的 最 小 的 N 是 N=341。 

这 个 算法 偶尔 会 出 错 ， 但 问题 是 它 总 出 一 些 相 同 的 错误 。 换 句 话 说， 存在 N 的 一 个 固 
定 的 集合 ， 对 于 这 个 集合 该 方法 行 不 通 。 我 们 可 以 尝试 将 该 算法 如 下 随机 化 : 随机 取 1< 
A-N-1, MUR AY '=1(mod N)， 则 宣布 N 可 能 是 素数 ， 和 否则 宣布 N 肯定 不 是 素数 。 如 
果 N=341 mi A—3. MARIÆ 3° —56(mod 341)。 因 此 ， 如 果 算 法 碰巧 选择 A=3, 
那么 它 将 对 N=341 得 到 正确 的 答案 。 

虽然 这 看 起 来 没有 问题 ， 但 是 却 存在 一 些 数 ， 对 于 A 的 某 些 选 择 它们 甚至 可 以 骗 过 该 
算法 。 一 种 这 样 的 数 集 叫 作 Carmichael 数 ， 这 些 数 不 是 素数 ， 可 是 对 所 有 与 N HERA O< 
A<N Si A‘ =1(mod N) 。 最 小 的 这 样 的 数 是 561。 因 此 ， 我 们 还 需要 一 个 附加 的 测 
试 来 改进 不 出 错 的 概率 。 

在 第 7 章 ， 我 们 证 明 过 一 个 关于 平方 探测 (quadratic probing) 的 定理 。 这 个 定理 的 特殊 
情况 如 下 : 
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定理 10. 11 如 果 P 忆 是 素数 且 0 二 X 二 P， 那 么 X'-1(mod P)RAH BAMA X=1, 
pi 

WEBB: X°=1(mod P) 意 味 着 X —1=0(mod P)。 这 就 是 说 ，(X 一 1)(X 十 1) 寺 0(mod 
P). HF PERK, 0<X<P, Ait P 必然 是 或 者 整除 (X 一 1),， 或 者 整除 (X 十 1)， 由 此 
推出 定理 。 

因此 ， 如 果 在 计算 A" "(mod N) 的 任意 时 刻 我 们 发 现 违背 了 该 定理 ， 那 么 可 以 断言 A 
不 是 素数 。 如 果 使 用 2. 4. 4 TURZA, 那么 Dabble nol en dhe 我 
们 修改 执行 对 N 的 求 余 运算 的 例 程 并 应 用 定理 10. 11 的 测试 。 这 种 方法 在 图 10-62 中 实现 。 





/* If Witness does not return 1, N is definitely */ 

/* composite. Do this by computing ( A ^ i ) mod N and */ 
/* looking for non-trivial square roots of 1 along the */ 
/* way. We are assuming very large numbers, so this */ 

/* is pseudocode */ 


HugeInt 
Witness( HugeInt A, HugeInt i, HugeInt N ) 
{ 

HugelInt X, Y; 


ifC i == 0) 
return 1; 


X = Witness( A, i / 2, NJi 
if( X == 0) /* If N is recursively composite, stop */ 
return 0; 





/* N is not prime if we find a non-trivial root of 1 */ 

¥=u CX * XX) BN: 

if( Y == 1 && X !=1 && X ! N - 1) 
return 0; 


if(i%2 120) 
Ya CAA YIAN 


return Y; 
} 
/* IsPrime: Test if N >= 3 is prime using one value */ 
/* of A. Repeat this procedure as many times as needed */ 
/* for desired error rate */ 


int 
IsPrime( HugeInt N ) 
{ 


return Witness( RandInt( 2, N- 2), N- 1, ND) = 1; 











图 10-62 一 种 概率 素性 测试 算法 


我 们 知道 ， 如 果 函 数 Witness 返回 任何 不 是 1 的 数 ， 那 么 它 就 已 经 证 明了 N 不 是 素 
数 ， 其 证 明 是 非 构 造 性 的 ， 因 为 它 并 没有 有 具体 给 出 找到 因子 的 方法 。 业 已 证 明 ， 对 于 任何 
(充分 大 的 )N， 至 多 有 A 的 (N 一 9)/4 个 值 会 使 该 算法 得 出 错误 的 结论 。 因 此 ， 如 果 A 是 
随机 选取 的 ， 而 且 算 法 的 结论 是 N( 很 可 能 ) 为 素数 ， 那 么 至 少 有 75% 的 时 机 算法 是 正确 的 。 


设 函数 Witness 运行 50 次 ， 则 算法 得 出 错误 结论 的 概率 是 子 。 因 此 ，50 次 独立 的 随机 试 
验 使 算法 出 错 的 概率 绝 不 会 超过 1/4” 二 2-'”。 实 际 上 这 是 非常 保守 的 估计 ， 它 只 对 B 
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些 选择 成 立 。 即 使 如 此 ， 人 们 更 可 能 看 到 的 是 硬件 的 错误 ， 而 不 是 对 于 数 的 素性 的 不 正确 
的 宣布 结果 。 


10.5 回溯 算法 


我 们 将 要 考察 的 最 后 一 个 算法 设计 技巧 是 回溯 (backtracking) 算 法 。 在 许多 情况 下 ， 回 
溯 算 法 相当 于 穷 举 搜索 的 巧妙 实现 ， 但 性 能 一 般 不 理想 。 不 过 ， 情 况 并 不 总 是 如 此 ， 即 使 
如 此 ， 在 某 些 情形 下 它 相 比 蛮 力 (brute force) 穷 举 搜索 ， 工 作 量 也 有 显著 的 节省 。 当 然 ， ja 
能 是 相对 的 : 对 于 排序 而 言 ，OCN? ) 的 算法 是 相当 差 的 ， 但 对 旅行 售货员 (或 任何 NP- SE 
全 ) 问 题 ，OCN ) 算 法 则 是 里 程 碑 式 结果 。 

回溯 算法 的 一 个 具体 例子 是 在 一 套 新 房子 内 摆 放 家 具 的 问题 。 存 在 许多 可 能 的 尝试 ， 
但 一 般 只 有 一 些 是 具体 要 考虑 的 。 开 始 什么 也 不 摆 放 ， 然 后 是 每 件 家 具 被 摆 放 在 室内 的 某 
个 部 分 。 如 果 所 有 的 家 具 都 已 摆好 而 且 户 主 很 满意 ， 那 么 算法 终止 。 如 果 摆 到 某 一 步 ， 该 
步 之 后 的 所 有 家 具 摆 放 方 法 都 不 理想 ， 那 么 我 们 必须 撤销 这 一 步 并 尝试 该 步 另 外 的 摆 放 方 
法 。 当 然 ， 这 也 可 能 导致 另外 的 撤销 ， 等 等 。 如 果 我 们 发 现 我 们 撤销 了 所 有 可 能 的 第 一 步 
摆 放 位 置 ， 那 么 就 不 存在 满意 的 家 具 摆 放 方 法 。 否 则 ， 我 们 最终 将 终止 在 满意 的 摆 放 位 置 
上 。 注 意 ,， 虽然 这 个 算法 基本 上 是 蛮 力 的 , 但 是 它 并 不 直接 尝试 所 有 的 可 能 。 例 如 ， 考 虑 
把 沙发 放 进 厨房 的 各 种 摆 法 是 绝 不 会 尝试 的 。 许 多 其 他 坏 的 摆 放 方法 早 就 取消 了 ， 因 为 令 
人 讨厌 的 摆 放 的 子 集 是 知道 的 。 在 一 步 内 删除 一 大 组 可 能 性 的 做 法 叫 作 裁剪 (pruning) 。 

我 们 将 看 到 回溯 算法 的 两 个 例子 。 第 一 个 是 计算 几何 中 的 问题 ， 第 二 个 例子 阐述 在 诸 
如 国际 象棋 和 西洋 跳棋 的 对 弈 中 如 何 计算 选取 行 棋 步 骤 的 问题 。 


10.5.1 收费 公路 重建 问题 


HAE NTA pis por cc py» EMF x88 b. x ep Ar 坐标。 进一步 假 设 
ZX1 王 0 以 及 这 些 点 从 左 到 右 给 出 。 这 NN 个 点 确定 在 每 一 对 点 间 的 N(N 一 1)/2 个 (不 必 是 唯 
一 的 ) 形 如 | xz; 一 zj | (i 了 站 的 距离 。 显 然 ， 如 果 给 定点 集 ， 那 么 容易 以 ON? ) 时 间 构 造 距离 
的 集合 。 这 个 集合 将 不 是 排序 的 , 但是， 如 果 我 们 愿意 花 ON? log N) 时 间 界 整理 ， 那 么 
这 些 距 离 也 可 以 被 排序 。 收 费 公 路 重建 问题 (turnpike reconstruction problem) 是 从 这 些 距 
ee 它 在 物理 学 和 分 子 生物 学 (参见 为 更 专门 的 信息 提供 线索 的 参考 文 
献 ) 中 都 有 应 用 。 这 个 名 称 得 自 于 对 美国 西海 岸 公路 上 那些 收 税 公路 出 口 的 模拟 。 正 像 大 数 
oe 重建 问题 也 比 建造 问题 困难 。 没 有 人 能 够 给 出 一 个 算法 以 保证 在 多 
项 式 时 间 内 完成 计算 。 我 们 将 要 介绍 的 算法 一 般 以 OCN* log N) 运 行 , 但 在 最 坏 情 形 下 可 
能 要 花费 指数 时 间 。 

当然 ， 若 给 定 该 问题 的 一 个 解 ， 则 可 以 通过 对 所 有 的 点 加 上 一 个 偏 移 量 而 构建 无 穷 多 
其 他 的 解 。 这 就 是 为 什么 我 们 一 定 要 将 第 一 个 点 置 于 0 处 以 及 构建 解 的 点 集 以 非 降 顺序 输 
出 的 原因 。 
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S D 是 距离 的 集合 ， 并 设 |D1|=M=NCN 一 1)/2。 作 为 例子 ， 设 
Bs {li oT 
由 于 |D|= 二 15， 因 此 我 们 知道 N==6。 算 法 以 置 x 二 0 开始。 显然 ，xs 二 10， 因 为 10 
是 D 中 最 大 的 元 素 。 将 10 从 DD 中 删除 ,我 们 得 到 的 点 和 剩 下 的 距离 如 下 图 所 示 。 


wi = (0 Se = 10 


D= l; 2a Zp 2 9s 2x Ss Je by Bs 5. 05 7438] 

剩 下 的 距离 中 最 大 的 是 8， 这 就 是 说 ， 要 么 zx; 二 2， 要 么 x; 二 8。 由 对 称 性 ， 我 们 可 以 
断定 这 种 选择 是 不 重要 的 ， 因 为 要 么 两 个 选择 都 引 向 解 ( 它 们 互 为 镜像 )， 要 么 都 不 会 引 向 
最 终 的 解 ， 所 以 我 们 可 置 x; 8 而 不 至 于 影响 问题 的 解 。 然 后 从 D 中 删除 距离 zs 一 zs 二 2 
和 zs 一 Zi 二 8， 得 到 


Sp 0 So 8 ve = 10 


Deuda 25 Za So 85 9» dq By Sy Sa Oy T) 
下 一 步 是 不 明显 的 。 由 于 7 是 了 中 最 大 的 数 ， 因 此 要 么 zx, 二 7， BAx.=3, WR r= 
7. BARA zs 一 7 二 3 M r: 一 7 二 1 也 必须 出 现在 D 中 。 我 们 一 看 便 知 它们 确实 在 D 中 。 
另 一 方面 ， 如 果 我 们 置 x; = 二 3， 那 么 3-2, =3 和 x; 一 3 二 5 就 必须 在 D 中 。 这 些 距 离 也 的 
确 在 D 中 。 因 此 ， 我们 不 对 哪 种 选择 做 强求 。 这 样 ， 我们 尝试 其 中 的 一 种 看 看 是 否 它 导致 
问题 的 解 。 如 果 它 不 行 ， 那 么 我 们 退回 来 再 尝试 男 外 的 那个 选择 。 尝 试 第 一 个 选择 我 们 置 
Xs 二 7， 得 到 


一 本 一 一 一 一 一 一 一 二 一 一 一 一 


x, =0 x4 = 7x5 = 8 Xg = 10 


Deid4,3 1,34. Ce Se 6} 

此 时 ,我 们 得 到 x —0. 2, =7, r; =8 和 xs 二 10。 现 在 最 大 的 距离 是 6， 因 此 要 么 
Xs 二 6， 要 么 x, 二 4。 但 是 ， 如 果 x6. 那么 x 一 zx; 二 1， 这 是 不 可 能 的 ， 因 为 1 不 再 属于 
D。 另 一 方面 ， 如 果 r:=4, 那么 zx; 一 zo 二 4 和 x; 一 zs 二 4， 这 也 是 不 可 能 的 ， 因 为 4 只 在 
D 中 出 现 一 次 。 因 此 ， 这 个 推导 思路 得 不 到 解 ， 我 们 需要 回溯 。 

由 于 a, =7 不 能 产生 解 ， 因 此 我 们 尝试 x; 二 3。 如 果 这 也 不 行 ， 那 么 我 们 停止 计算 并 报 
告 无 解 。 现 在 ， 我们 有 








D= {15 Bs 25 3, 3, 4, 5, b, 6) 
我 们 必须 再 一 次 在 c. =6 和 x; 二 4 之 间 选 择 。x; 二 4 是 不 可 能 的 ， 因 为 D 只 出 现 一 个 
4， 而 该 选择 意味 着 要 有 两 个 。zi =6 是 可 能 的 ， 于 是 我 们 得 到 


| 403] 


x, =0 X5 = 3 x4 = 6 Xs — ws = 10 


Dei. 2y Br 8x 5] 
唯一 剩 下 的 选择 是 zs 一 5， 这 是 可 以 的 ， 因 为 它 使 得 D 成 为 空 集 ， 因 此 我 们 得 到 问题 的 一 
个 解 。 
SS MGE USE MEME LM RERE MM 
x10 X5 —3 X3 — 5x46 x5 = 8 xe = 10 
D-—1] 

图 10-63 是 一 棵 决策 树 ， 代 表 为 得 到 解 而 采取 的 行动 。 这 里 ， 我 们 没有 对 分 支 作 标记 ， 
而 是 把 标记 放 在 了 分 支 的 目的 节点 上 。 带 有 一 个 星 号 的 节点 表示 这 些 所 选 的 点 与 给 定 的 距 


离 不 一 致 ， 带 有 两 个 星 号 的 节点 只 有 将 不 可 能 的 节点 作为 儿子 节点 ， 因 此 表示 一 条 不 正确 
的 路 径 。 


ER SSS Pt m iua 
(x3=6*) X2=4*) x3=4*) { x4=6 | 
. iif. A i 


图 10-63 收费 公路 重建 问题 的 决策 树 


实现 这 个 算法 的 伪 代 码 大 部 分 都 一 一 
很 简单 。 驱 动 例 程 Turnpike 如 | ee int X[ ], DistSet D, int N ) 
图 10-64 所 示 。 它 接收 点 的 数组 X( 不 | pay © xa 
需要 初始 化 ) 、 距 离 的 数组 D 和 Ne。 A XEN 
如 果 找 到 一 个 解 ， 则 返回 true， 答 案 | 7777 O 
将 被 放 到 X 中 ,而 也 将 是 空 集 。 否 Aa ona a e 


return Place( X, D, N, 2, N- 2); 





0; 

DeleteMax( D ); 

] » DeleteMax( D ); 
]-X[N-1]e& D) 











则 , 返回 false. X 将 是 未 定义 的 ， 

距离 数组 将 是 未 触及 的 。 该 例 程 如 上 | 77, Mac: 

所 述 给 zx ry 和 zx NET fü. Birk -一 

T D， 并 且 调 用 了 回溯 算法 Place 以 图 10-64 收费 公路 重建 算法 : 驱动 例 程 ( 伪 代 码 ) 


日 ”为 了 方便 起 见 ， 所 举 的 例子 使 用 了 单字 母 变量 名 ， 一般 说 来 这 不 是 好 习惯 。 为 了 简单 ， 我 们 也 不 给 出 变量 的 
类 型 。 
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放置 其 余 的 点 。 我 们 假设 为 保证 | D| = 二 NC(N 一 1)/2 已 经 进行 了 检验 。 

更 困难 的 部 分 是 回溯 算法 ， 如 图 10-65 所 示 。 与 大 多 数 回溯 算法 一 样 ， 最 方便 的 实现 
方法 是 递归 。 我 们 传递 同样 的 参数 以 及 界 Left 和 Rights Tens o Luo E RINER H 
置 的 点 的 坐 标 。 如 果 厂 是 空 集 (或 Left 二 Right)， 那 么 解 已 经 找到 ， 我 们 可 以 返回 。 和 否 
则 ， 我 们 首先 尝试 使 trio 二 D;。,。 如 果 所 有 适当 的 距离 都 (以 正确 的 值 ) 出 现 ， 那 么 尝试 性 
地 放 上 这 一 点 ， 删 除 这 些 距 离 ， 并 尝试 从 Left 到 Rignt 一 1 填 人 。 如 果 这 些 距 离 不 出 现 ， 
或 者 从 Left 到 Right 一 1 填 人 尝试 失败 ， 那 么 我 们 尝试 置 nus 二 zw 一 daw， 使 用 类 似 的 方 
法 。 如 果 这 样 不 行 ， 则 问题 无 解 ， 否则 ， 一 个 解 已 经 找到 ， 而 这 个 信息 最 终 通过 return 
语句 和 X 数组 传递 回 Turnpike. 





/* Backtracking algorithm to place the points */ 
/* XL Left ... Right ] */ 

/* X[ 1 ... Left - 1] and X[ Right »« 1 ... N] */ 
/* are already tentatively placed */ 

/* If Place returns True, */ 

/* then X[ Left ... Right ] will have values */ 


int 
Place( int X[ ], DistSet D, int N, int Left, int Right ) 
{ 


int DMax, Found = False; 


/* 1*7 ifC D is empty ) 
e 2*4 return True; 
/* 3*/ DMax = FindMax( D ); 


/* Check if setting X[ Right ] = DMax is feasible */ 
f^ 4*/ if(| XL j 1 - DMax | € D 
for all 1 < j «Left and Right <j <s N) 
{ 


/* 5*/ X[ Right ] = DMax; /* Try X[ Right ] = DMax */ 
£* 6*/ for( 1 <= j < Left, Right <j  N) 
y*. TEF Delete( | X[ j ] - DMax |, DD; 
/* 8*/ Found = Place( X, D, N, Left, Right - 1); 
/* 9*/ if( !Found ) /* Backtrack */ 
/*10*/ for( 1 = j < Left, Right < j  N) /* Undo deletion */ 
Vi N Bah d Insert( | XE j = DMax |, D D; 
j 


/* If first attempt failed, try to see if setting */ 
/* X[ Left ] = X[ N ] - DMax is feasible */ 


/*12*/ ifC !Found && ( | XN] - DMax - XL j1le D 
PFL for all 1 = j « Left and Right <j = N) ) 
{ 
/*14*/ X[ Left ] = XL N ] - DMax; /* Same logic as before */ 
pe A for( 1 = j < Left, Right <j = NJ 
| /*16*/ Delete( | X[ N ] - DMax - XL j 1 1, D); 
/*17*/ Found = Place( X, D, N, Left + 1, Right ); 
/*18*/ if( !Found ) /* Backtrack */ 
[*39*/ forC 1 = 3 < Left, Right <j € NJ /* Undo */ 
| 72057 Insert( | XXN ] = DMax - XL 3] 1, DD; 
} 
/*21*/ return Found; 











图 10-65 收费 公路 重建 算法 : 回溯 的 步骤 ( 伪 代 码 ) 


算法 的 分 析 涉 及 两 个 因素 。 设 第 9 一 11 行 以 及 第 18 一 20 行 从 未 执行 。 我 们 可 以 把 也 作 
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为 平衡 二 又 查找 (或 伸展 ) 树 保存 (当然 ， 这 需要 对 代码 做 些 修改 )。 如 果 我 们 从 未 回溯 ， 那 
么 最 多 有 ON ) 次 操作 涉及 D， 如 在 第 4 行 、 第 12—13 行 中 蕴含 的 删除 和 Fina. Sie 
是 对 删除 提出 的 ， 因 为 D 有 OCN’) 个 元 素 而 没有 元 素 被 重新 搬入。 每 次 对 Place 的 调用 最 
多 用 到 2N 次 Find. MHF Place 在 该 分 析 中 从 未 回溯 ， 因 此 最 多 可 以 有 2N 次 Find. 
于 是 ， 如 果 没 有 回溯 ， 那 么 运行 时 间 为 ON’ log ND. 

当然 ， 回 溯 是 要 发 生 的 。 如 果 回 漳 反 复发 生 ， 那 么 算法 的 性 能 就 要 受到 影响 。 我 们 可 
以 通过 构建 病态 的 情形 迫使 它 发 生 。 经 验证 明 ， 如 果 点 的 整数 坐标 在 L0，D,s; | 均匀 地 和 随 
机 地 分 布 ， 其 中 Ds 一 B(N?)， 那 么 在 整个 算法 期 间 几 乎 肯定 最 多 执行 一 次 回溯 。 


10.5.2 E7 


作为 最 后 一 个 应 用 ， 我 们 将 考虑 计算 机 用 来 进行 战略 游戏 的 策略 ， 如 西洋 跳棋 或 国际 
象棋 。 作 为 一 个 例子 ,我 们 将 使 用 简单 得 多 的 三 连 游戏 棋 (tic-tac-toe) 游 戏 ， 因 为 它 使 得 想 
法 更 容易 表述 。 

如 果 双 方 都 玩 到 最 优 ， 那 么 三 连 游戏 棋 就 是 平局 。 通 过 进行 仔细 的 逐个 情况 的 分 析 ， 
构造 一 个 从 不 输 棋 而 且 当 机 会 出 现时 总 能 赢 棋 的 算法 并 不 是 困难 的 事 。 这 之 所 以 能 够 做 到 
是 因为 一 些 位 置 是 已 知 的 陷阱 ， 可 以 通过 查 表 来 处 理 。 另 外 一 些 方法 (如 当中 央 的 方 格 可 用 
时 占据 该 方 格 ) 可 以 使 得 分 析 更 简单 。 如 果 完 成 了 分 析 ， 那么 通过 使 用 一 个 表 我 们 总 可 以 只 
根据 当前 位 置 选择 一 步 棋 。 当 然 ， 这 种 方法 需要 程序 员 而 不 是 计算 机 来 进行 大 部 分 的 思考 。 


极 小 极 大 策略 

更 一 般 的 策略 是 使 用 一 个 赋值 函数 来 给 一 个 位 置 的 “好 坏 ” 定 值 。 能 使 计算 机 获胜 的 
位 置 可 以 得 到 值 十 1; 平局 可 得 到 0; 使 计算 机 输 棋 的 位 置 得 到 值 一 1。 通 过 考察 盘面 能 够 确 
定 这 局 棋 输 赢 的 位 置 叫 作 终端 位 置 (terminal position), 

如 果 一 个 位 置 不 是 终端 位 置 ， 那 么 该 位 置 的 值 通过 递归 地 假设 双方 最 优 棋 步 而 确定 。 
这 叫 作 极 小 极 大 Cminimax) 策 略 ， 因 为 下 棋 的 一 方 ( 人 ) 试 图 使 这 个 位 置 的 值 极 小 化 ， 而 另 一 
方 (计算 机 ) 却 要 使 它 的 值 极 大 。 

位 置 P 的 后 继 位 置 (successor position) 是 通过 从 PP 走 一 步 棋 可 以 达到 的 任何 位 置 P.。 
如 果 当 在 某 个 位 置 已 计算 机 要 走 棋 ， 那 么 它 递 归 地 求 出 所 有 的 后 继 位 置 的 值 。 计 算 机 选择 
具有 最 大 值 的 一 步行 棋 ， 这 就 是 乙 的 值 。 为 了 得 到 任意 后 继 位 置 P. 的 值 ， 要 递归 地 算出 
P, 的 所 有 后 继 位 置 的 值 ， 然 后 选取 其 中 最 小 的 值 。 这 个 最 小 值 代表 行 棋 人 一 方 最 赞成 的 
应 招 。 

图 10-66 中 的 程序 使 得 计算 机 的 策略 更 清楚 。 第 1 一 4 行 直 接 给 赢 棋 或 平局 赋值 。 如 果 
这 两 个 情况 都 不 适用 ， 那么 这 个 位 置 就 是 非 终端 位 置 。 注 意 到 value 应 该 包括 所 有 可 能 后 
继 位 置 的 最 大 值 ， 第 5 行 把 它 初 始 化 为 最 小 的 可 能 值 ， 第 6 ~ 13 行 的 循环 则 为 了 改进 而 进 
行 搜索 。 每 一 个 后 继 位 置 递归 地 依次 由 第 8 一 10 行 算出 值 来 。 因 为 我 们 将 看 到 过 程 Find- 
HumanMove 调用 FindcompMove， 所 以 这 是 递归 的 。 如 果 下 棋 人 对 一 步 棋 的 应 招 给 计算 机 
留 下 比 计算 机 在 前 面 最 佳 棋 步 所 得 到 的 位 置 更 好 的 位 置 ， 那 么 Value 和 BestMove 将 被 更 
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新 。 图 10-67 显示 的 是 下 棋 人 选择 棋 步 的 过 程 。 除 了 下 棋 人 选择 的 棋 步 导致 最 低 值 的 位 置 
外 ， 所 有 的 逻辑 实际 上 都 是 相同 的 。 事实 上 ， 通 过 传递 一 个 额外 的 变量 不 难 把 这 两 个 过 程 
合并 成 一 个 ， 这 个 额外 变量 指出 该 谁 走 棋 。 这 样 一 来 确实 使 得 程序 多 少 有 些 难于 读 懂 了 ， 
因此 我 们 就 停留 在 两 个 分 开 的 例 程 的 阶段 。 





/* Recursive procedure to find best move for computer */ 

/* BestMove points to a number from 1 to 9 indicating square */ 
/* Possible evaluations satisfy CompLoss < Draw < CompWin */ 

/* Complementary procedure FindHumanMove is Figure 10.67 */ 

/* Board is an array and thus can be changed by Place */ 


void 
FindCompMove( BoardType Board, int *BestMove, int *Value ) 
{ 


int Dc, i, Response; /* Dc means don't care */ 


/* 1*/ if( FullBoard( Board ) ) 
/* 2*/ *Value - Draw; 
else 
fe 3*7 if( ImmediateCompWin( Board, BestMove ) ) 
/* 4*/ *Value - CompWin; 
| else 
| { 
JX 5*/ *Value = CompLoss; 
/* 677 for( i = 1; i <= 9; i++ ) /* Try each square */ 
{ 
/* 7*/ if( IsEmpty( Board, i ) ) 
{ 
J= 8*7 Place( Board, i, Comp ); 
yf* 9*/ FindHumanMove( Board, &Dc, &Response ); 
| 7/*10*/ Unplace( Board, i ); /* Restore Board */ 
| /*11*/ if( Response > *Value ) 
{ 
/* Update best move */ 
/*12*/ *Value = Response; 
/*13*/ *BestMove - i; 
} 
} 











图 10-66” 极 小 极 大 三 连 游戏 棋 算法 : 计算 机 的 选择 


由 于 这 两 个 例 程 必须 要 传 回 位 置 的 值 和 最 佳 的 棋 步 ， 因 此 我 们 通过 使 用 指针 来 传递 将 
得 到 这 些 信息 的 两 个 变量 的 地 址 。 现 在 ， 最 后 的 两 个 参数 回答 的 就 不 是 “是 什么 ”而 是 
“在 哪里 ”了 。 

作为 一 个 例子 ， 在 图 10-66 中 BestMove 包含 可 以 放置 最 佳 棋 步 的 地 址 。FindComp- 
Move 通过 访问 *BestMove 可 以 考察 或 修改 这 个 地 址 中 的 数据 。 第 9 行 指出 主 调 例 程 应 该 
怎样 运行 。 由 于 调用 程序 有 两 个 准备 存放 数据 的 整数 ， 而 FindHumanMove 只 要 这 两 个 整 
数 的 地 址 ， 因 此 这 里 用 到 了 地 址 操作 符 &。 

如 果 在 第 9 行 不 用 操作 符 <， 并且 Dc 和 Response 均 为 零 ( 这 是 典型 的 未 初始 化 数 
Hi), ABA FindHumanMove 将 试图 把 最 佳 模 步 和 位 置 值 放 到 内 存 位 置 零 处 。 当 然 ， 这 不 是 
我 们 想 要 的 ， 并 将 几乎 肯定 导致 程序 崩溃 ( 试 一 试 !) 。 这 是 在 使 用 库 函 数 中 的 scant A PR 
数 时 最 常见 的 错误 。 
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void 
FindHumanMove( BoardType Board, int *BestMove, int *Value ) 


{ 


int Dc, i, Response; /* Dc means don't care */ 


fe qe if( FullBoard( Board ) ) 
f® 2*7 *Value = Draw; 

else 
yE 3*/ if( ImmediateHumanWin( Board, BestMove ) ) 
J*" 4*7 *Value = CompLoss; 

else 

{ 
Y= SOF *Value = CompWin; 
[P5657 for( i = 1; i <= 9; i++ ) /* Try each square */ 

{ 
fe 7*7 if( IsEmpty( Board, i ) ) 
{ 
fr B Place( Board, i, Human ); 
S 9*4 FindCompMove( Board, &Dc, &Response ); 
/*10*/ Unplace( Board, i ); /* Restore board */ 
/*11*/ if( Response « *Value ) 
{ 


/* Update best move */ 
/*12*7 *Value - Response; 
/*13*/ *BestMove - i; 
} 
} 
} 











图 10-657 极 小 极 大 三 连 游戏 棋 算 法 : 人 的 选择 


我 们 把 一 些 支 持 例 程 留 作 练 习题 。 代 价 最 高 的 计算 是 需要 计算 机 开局 的 情形 。 由 于 在 这 
个 阶段 棋局 处 于 平局 的 形势 ， 因 此 计算 机 选择 方 格 1” 。 需 要 考察 的 位 置 总 共有 97 162 个 ， 计 
算 要 花费 几 秒 。 没 有 优化 程序 的 打算 。 如 果 下 棋 人 选择 中 央 方 格 ， 那 么 当 计算 机 走 第 二 步 棋 
的 时 候 ， 所 要 考察 的 位 置 的 个 数 是 5 185 个 ， 当 下 棋 人 选择 一 个 角 上 的 方 格 时 ， 计 算 机 所 要 考 
察 的 位 置 是 9761 个 ， 而 当下 横 人 选择 非 角 的 边 上 的 方 格 时 计算 机 要 考察 13 233 个 位 置 。 

对 于 更 复杂 的 游戏 ， 如 西洋 跳 横 和 国际 象棋 ， 搜 索 到 终端 节点 的 全 部 棋 步 显然 是 不 可 
行 的 5 。 在 这 种 情况 下 ， 我 们 在 达到 递归 的 某 个 深度 之 后 只 能 停止 搜索 。 递 归 停 止 处 的 节点 
则 成 为 终端 节点 。 这 些 终端 节点 的 值 由 一 个 估计 位 置 的 值 的 函数 计算 得 出 。 例 如 ， 在 一 个 
下 棋 程 序 中 ， 求 值 函 数 计量 诸如 棋子 和 位 置 因素 的 相对 量 和 强度 这 样 一 些 变量 。 求 值 函数 
对 于 成 功 是 至 关 重 要 的 ， 因 为 计算 机 的 行 棋 选 步 是 基于 将 这 个 函数 极 大 化 的 。 最 好 的 计算 
机 下 棋 程 序 的 求 值 函数 惊人 的 复杂 。 

然而 ， 对 于 计算 机 下 棋 ， 一 个 最 重要 的 因素 看 来 是 程序 能 够 向 前 看 的 棋 步 的 数目 。 有 
时 我 们 称 之 为 层 (ply)， 它 等 于 递归 的 深度 。 为 了 实现 这 个 功能 ， 需 要 给 予 搜索 例 程 一 个 额 
外 的 参数 。 

在 对 弈 程序 中 增加 向 前 看 步 因素 的 基本 方法 是 提出 一 些 方法 ， 这 些 方法 对 更 少 的 节点 





O ”我 们 将 方 格 从 棋盘 左上 角 开 始 向 右 编 号 。 不 过 ， 这 只 对 支持 例 程 是 重要 的 。 
© ” 据 估 计 ， 假 如 对 下 棋 进行 这 种 搜索 ,那么 对 于 第 一 步 棋 至 少 有 10'” 个 位 置 需 要 考察 。 即 使 将 本 节 稍 后 描述 的 
改进 方法 结合 使 用 ， 这 个 数字 也 不 能 降低 到 实用 的 水 平 。 
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求 值 但 却 不 丢失 任何 信息 。 我 们 已 经 看 到 的 一 种 方法 是 使 用 一 个 表 来 记录 所 有 已 经 被 计算 
过 值 的 位 置 。 例 如 ， 在 搜索 第 一 步 棋 的 过 程 中 ,程序 将 考察 图 10-68 中 的 一 些 位 置 。 如 果 
这 些 位 置 的 值 被 存储 了 ， 那么 一 个 位 置 在 第 二 次 出 现时 就 不 必 再 重新 计算 ; 它 基 本 上 变 成 
了 一 个 终端 位 置 。 记 录 这 些 信息 的 数 


























m X © |x xX |O 
H 25 #4 "| fp Æ 3& & (transposition | eee NP = 
table). ， 它 几乎 总 可 通过 散 列 来 实现 。 一 | 一 SS [e ee 
在 许多 情况 下 ， 这 可 以 节省 大 量 的 计 
算 。 例 如， 在 一 盘 棋 的 最 后 阶段 , 此 x| | mae x |o |x 
时 相对 来 说 只 有 很 少 的 棋子 ， 时 间 的 - - 
节省 使 得 一 步 搜索 可 以 进行 到 更 深 的 gnuwLgG 





若干 层 。 

op 裁剪 

人 们 一 般 能 够 取得 的 最 重要 的 改进 称 为 aB RY Ca-8 pruning), BI 10-69 显示 在 一 盘 假 
想 的 棋局 中 用 来 给 某 个 假设 的 位 置 求 值 的 一 些 递归 调用 的 迹 。 通 常 这 叫 作 一 棵 博弈 树 (game 
tree) 。( 到 现在 为 止 我 们 一 直 回 避 使 用 这 个 术语 ， 因 为 它 多 少 有 些 令 人 误解 : 没有 树 是 由 该 
算法 具体 构造 的 。 博 弈 树 只 是 一 个 抽象 的 概念 。) 这 棵 博弈 树 的 值 为 44。 


图 10-68 到 达 相同 位 置 的 两 种 搜索 






27) 


S l 
e d 68 78) 36) 86) 
A OA Jj A A 9 
i j A j Là gear 
dhea Wm 68) 17) 69) 67) 03) 63) 6o) 6o) (A?) 64) €) 67) 69 69) 69 6065) (2 66) 


图 10-69 一 棵 假想 的 博弈 树 


图 10-70 显示 同一 棵 博弈 树 的 求 值 ， 它 有 一 些 尚未 求 值 的 节点 。 几 乎 有 一 半 的 终端 节 
点 没有 检验 。 我 们 证 明 计算 它们 的 值 将 不 改变 树 根 的 值 。 
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图 10-70 一 棵 被 裁减 的 博弈 树 
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首先 ， 考 虑 节点 D。 图 10-71 显示 在 给 D 求 值 时 已 经 搜集 到 的 信息 。 此 时 ,我们 仍然 
处 在 FindHumanMove 中 并 正在 打算 对 D 调用 FindCompMove. Aili, RNG A A 
FindHumanMove 最 多 将 返回 40， 因 为 它 是 一 个 Min 节点 。 另 一 方面 ， 它 的 Max 节点 父 节 
点 已 经 找到 一 个 保证 44 的 顺序 。 注 意 ， 无 论 如 何 也 不 可 能 增加 这 个 值 。 因 此 ， 不 需要 
求 值 。 该 树 的 这 个 裁减 叫 作 a 裁减。 同样 的 情况 出 现在 节点 B。 为 了 实现 aR. Find- 
CompMove 将 它 的 尝试 性 的 极 大 值 (a) 传 递 给 FindHumanMove。 如 果 FindHumanMove 的 
尝试 性 的 极 小 值 低 于 这 个 值 ， 那 么 FindHumanMove 立即 返回 。 


Aa » 
图 10-71 标记 “?” 的 节点 是 不 重要 的 





1| 类 似 的 情况 也 发 生 在 节点 A 和 C。 这 一 次 ,我 们 在 FindcompMove 的 中 间 ， 并 且 正 要 

| 调用 FindHumanMove 以 计算 C 的 值 。 图 10-72 显示 在 节点 C 遇 到 的 这 种 情况 。 不 过 ， 调 

| JH T FindCompMove 的 FindHumanMove 在 Min 层 上 , 已 经 确定 它 能 够 迫使 一 个 值 最 高 到 
44( 注 意 ， 对 于 下 棋 人 这 一 方 低 的 值 是 好 的 )。 由 于 FindCompMove 有 一 个 尝试 性 的 最 大 值 
68， 因 此 C 在 Min 层 上 怎么 做 也 不 会 影响 到 这 个 结果 。 因 此 ，C 不 应 该 求 值 。 这 种 类 型 的 
裁减 叫 作 8 裁减 ， 它 是 a 裁减 的 对 称 形式 。 当 两 种 方法 结合 起 来 时 我 们 得 到 a-B 裁减 。 
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图 10-72 标记 “?” 的 节点 是 不 重要 的 


实现 a-B 裁减 所 需 代码 少 得 惊人 。 图 10-73 显示 的 是 a-B 裁减 方案 的 一 半 ( 减 去 类 型 说 
明 )。 你 应 该 能 够 写 出 男 一 半 代 码 而 不 会 遇 到 任何 麻烦 。 

为 了 充分 利用 og 裁减 ， 对 卒 程序 通常 尽量 对 非 终 端 节点 应 用 求 值 函数 ， 力 图 把 最 好 的 
棋 步 早 一 些 放 到 搜索 范围 内 。 这 样 的 结果 甚至 比 随机 裁减 方案 还 要 裁减 得 多 。 像 以 积极 的 
方式 进行 更 深入 的 搜索 等 其 他 方法 也 在 使 用 。 

在 实践 中 ，a-B 裁减 把 搜索 限制 在 只 有 O(CVN) 个 节点 上 ， 这 里 N 是 整个 博弈 树 的 大 
小 。 这 是 巨大 的 节约 ， 它 意味 着 使 用 cQ 裁减 的 搜索 与 非 裁减 树 相 比 能 够 进行 到 两 倍 的 深 
度 。 我 们 的 三 连 游戏 棋 例 子 是 不 理想 的 ， 因 为 存在 太 多 相同 的 值 ， 但 即使 是 这 样 ， 最 初 对 


$103 算法 设计 技巧 


97 162 个 节点 的 搜索 还 是 被 减 到 了 4493 个 节点 (这 些 计 数 包括 非 终 端 节点 )。 








/* Same as before, but perform alpha-beta pruning */ 
/* The main routine should make the call with */ 
/* Alpha = CompLoss and Beta = CompWin */ 


void 

FindCompMove( BoardType Board, int *BestMove, int *Value, 
int Alpha, int Beta ) 

{ 


int Dc, i, Response; /* Dc means don't care */ 


fe Ix if( FullBoard( Board ) ) 
[5 2*7 *Value - Draw; 

else 
2*9 357 if( ImmediateCompWin( Board, BestMove ) ) 

iis ii *Value - CompWin; 

else 

{ 
[e 5b*/ *Value = Alpha; 
/* 6*/ for( i = 1; i <= 9 && *Value « Beta; i++ ) 

{ 
£5 TY. if( IsEmpty( Board, i ) ) 
{ 
/* 8*/ Place( Board, i, Comp ); 
/> 9*/ FindHumanMove( Board, &Dc, &Response, 
*Value, Beta ); 
/*310*/ Unplace( Board, i ); /* Restore board */ 
Va if( Response > *Value ) 
{ 
/* Update best move */ 
/*12*/ *Value = Response; 
/*13*/ *BestMove = i; 
} 











图 10-73 #4 a-b 裁减 的 极 小 极 大 三 连 游戏 棋 算法 : 计算 机 棋 步 的 选择 
在 许多 对 弈 领域 ， 计 算 机 跻身 于 世界 最 优秀 弈 者 之 列 。 所 使 用 的 方法 是 非常 有 趣 的 ， 
而 且 可 以 应 用 到 一 些 更 严肃 的 问题 上 。 更 多 的 细节 可 见 参考 文献 。 
Q 总 结 


这 一 章 阐述 了 在 算法 设计 中 发 现 的 五 个 最 普通 的 方法 。 当 面临 一 个 问题 的 时 候 ， 花 些 时 间 
考察 一 下 这 些 方法 能 否 适用 是 值得 的 。 算 法 的 适当 选择 ,结合 数据 结构 的 审慎 使 用 ， 和 常常 
能 够 迅速 导致 问题 的 高 效 解决 。 


Q 练习 

10. 1 证 明 贪 焚 算 法 可 以 将 多 处 理 器 作业 调度 工作 的 平均 完成 时 间 最 小 化 。 

10.2 VELA, jes ts jn 为 输入 ， 其 中 的 每 一 个 作业 都 要 花 一 个 时 间 单 位 来 完成 。 如 
果 每 个 作业 方 在 时 间 限 度 内 完成 ， 那 么 将 挣 得 d, 美元 ， 但 若 在 时 间 限 度 以 后 完成 
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x10. 
22 


则 挣 不 到 钱 。 
a. 给 出 一 个 O(N? ) 贪 禁 算 法 求解 该 问题 。 


xxb. 修改 你 的 算法 以 得 到 O(N log N) 的 时 间 界 。 提 示 : 时 间 界 完全 归 因 于 将 作业 按 


21 


照 金额 排序 。 算 法 的 其 余部 分 可 以 使 用 不 相交 集 数据 结构 以 o(N log NN) 实 现 。 
一 个 文件 以 下 列 频率 包含 冒号 、 空 格 、 换 行 (newline) 、 逗 号 和 数字 : 冒号 (100)， 
2s (605), M&ET(100), (705), 0(431), 1(242), 2(176), 3(59), 4(185), 
5(250), 6(174), 7(199), 8(205), 9(217), WEE: Huffman 编码 。 
编码 文件 有 一 部 分 必须 是 指示 Huffman 编码 的 文件 头 。 给 出 一 种 方法 构建 大 小 最 多 
为 O(NN) 的 文件 头 ( 除 符号 外 )， 其 中 N 是 符号 的 个 数 。 
证 明 Huffman 编码 生成 最 优 的 前 级 码 。 
证 明 : 如 果 符 号 是 按照 频率 排序 的 ， 那 么 Huffman 算法 可 以 以 线性 时 间 实 现 。 
用 Huffman 算法 写 出 一 个 程序 实现 文件 压缩 (和 解压 缩 )。 


证 明 : 通过 考虑 下 述 项 的 序列 可 以 迫使 任意 联机 装 箱 算法 至 少 使 用 六 最 优 箱子 数 : 





N 项 大 小 为 二 一 2s， N HAAS +e, N HANA e. 


解释 如 何以 时 间 O(N log N) 实 现 首次 适合 算法 和 最 佳 适 合算 法 。 

指出 在 10. 1. 3 节 讨 论 的 所 有 装 箱 方法 对 输入 0.42, 0.25, 0.27, 0.07, 0.72, 
0,808, 0.08, O44, 5,50, 0.68, 0.73, D.21, 0.08, 17, 0,19, 0.397, 0.78, 
0. 23, 0.30 的 操作 。 

编写 一 个 程序 比较 各 种 装 箱 试探 方法 (在 时 间 上 和 所 用 箱子 的 数量 上 ) 的 性 能 。 

证 明定 理 10. 7。 

证 明定 理 10. 8。 

将 N 个 点 放 人 一 个 单位 方 格 中 。 证 明 最 近 一 对 点 之 间 的 距离 为 ON |”). 

论证 对 于 最 近 点 算法 ， 在 带 内 的 平均 点 数 是 O(VN)。 提 示 : 利用 前 一 道 练习 的 
结果 。 

编写 一 个 程序 实现 最 近 点 对 算法 。 

使 用 三 分 化 中 项 的 中 项 方法 ， 快 速 选择 算法 的 渐 近 运行 时 间 是 多 少 ? 

证 明 七 分 化 中 项 的 中 项 的 快速 选择 算法 是 线性 的 。 为 什么 证 明 中 不 用 七 分 化 中 项 的 
中 项 方法 ? 
实现 第 7 章 中 的 快速 选择 算法 ,快速 选择 使 用 五 分 化 中 项 的 中 项 方法 ， 并 实现 
10. 2. 3 节 末 尾 的 抽样 算法 。 比 较 它们 的 运行 时 间 。 

许多 用 于 计算 五 分 化 中 项 的 中 项 的 信息 都 被 丢弃 了 。 指 出 怎样 通过 更 仔细 地 使 用 这 
些 信息 减少 比较 的 次 数 。 

完成 在 10. 2. 3 节 末 尾 描述 的 抽样 算法 的 分 析 ， 并 解释 6 和 s 的 值 如 何 选择 。 

指出 如 何 用 递归 乘 算法 计算 XY, 其 中 X=1 234, Y=4 321。 要 包括 所 有 的 递归 
WX. 


























x 10. 
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.23 ”指出 如 何 只 使 用 三 次 乘法 将 两 个 复数 X=a 十 bi MI Y=ctdi HR, 
.24 a. 证 明 


KY e + ey = (Xi FARY e + Ya) NY XRYE 
b. 它 给 出 进行 N 位 的 数 的 乘法 的 O(N'”) 算 法 。 将 该 方法 与 课文 中 的 解法 进行 
比较 。 


. 25 xa. 指出 如 何 通 过 求解 大 约 为 原 问 题 三 分 之 一 大 小 的 五 个 问题 来 完成 两 个 数 的 乘法 。 


xxb. 将 该 问题 推广 得 出 一 个 O(N T BJARQER, Bh e> 为 任意 参数 。 
c. 在 8 问 中 的 算法 比 O(N log NN) 好 吗 ? 





.26 为 什么 Strassen 算法 在 2X2 矩阵 的 乘法 中 不 使 用 可 交换 性 是 重要 的 。 
.27 两 个 70X70 和 矩阵 可 以 使 用 143 640 次 乘法 相 乘 。 指 出 这 如 何 能 够 用 于 改进 由 Stras- 





sen 算法 给 出 的 界 。 


.28 计算 ALAS AIALALA 的 最 优 方法 是 什么 ?” 其 中 ,这些 矩阵 的 阶 数 为 Ai: 10X 20, 


As: 20X1, As: 1X40, Ay: 40X5, As: 5X30, Ag: 30X15, 


.29 ”证 明 下 列 贪 禁 算 法 均 不 能 进行 链 式 矩阵 乘法 。 在 每 一 步 


a. 计算 最 节省 的 乘法 。 
b. 计算 最 昂贵 的 乘法 。 
c， 计 算 两 个 矩阵 M; 和 Mi 之 间 的 乘法 使 得 在 M, 中 的 列 数 最 小 (使 用 上 面 法 则 之 一 )。 





.30 编写 一 个 程序 计算 矩阵 乘法 的 最 佳 顺 序 。 注 意 ， 程 序 要 显示 具体 的 顺序 。 
.31 指出 下 列 单 词 的 最 优 二 又 查找 树 ， 其 中 括号 内 是 单词 出 现 的 频率 : a(0.18), and 


(0.19), 1(0.23), it(0. 21), or(0. 19), 





.32 将 最 优 二 又 查找 树 算法 扩展 到 可 以 对 不 成 功 的 搜索 进行 。 在 这 种 情况 下 ，9 是 对 任 


ERE w,-—W-w;a gs] W 执行 一 次 查找 的 概率 ， 其 中 ISN, go 是 对 WK 
wi 的 单词 W 执行 一 次 查找 的 概率 ， 而 gn 是 对 W ws 执行 一 次 查找 的 概率 。 注 
=, Met Sia = ls 


j=0 


33 i&C,—0, 否则 





Ci; = Wi; + min (Cra 十 Co) 
Wr W 满足 四 边 形 不 等 式 (quadrangle inequality)， 即 对 所 有 的 ici Sjj’, 
Wij + Wi < Wi + Wiy 
进一步 假设 W 是 单调 的 : 如 果 ii’ i<j’, BA WW. 
a. 证 明 C 满足 四 边 形 不 等 式 。 
b. 令 R 是 使 Co 十 Cu 达到 最 小 值 的 最 大 的 &( 也 就 是 说 ， 在 相等 的 情形 下 选择 最 
大 的 &) 。 证 明 : 














Riy S Ri S Roen 
TERA R a 1 TAF EAE HY o 
d. 用 它 证 明 C 中 所 有 的 项 可 以 以 O(N  ) 计 算 。 
e. 使 用 这 些 技巧 可 以 以 O(N? ) 解 决 哪个 动态 规划 算法 ? 


p 
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编写 一 个 例 程 从 10. 3. 4 节 中 的 算法 重新 构造 那些 最 短路 径 。 

在 你 的 计算 机 系统 上 考察 随机 数 发 生 器 。 其 随机 性 如 何 ? 

编写 在 跳跃 表 中 执行 插入 、 删 除 以 及 查找 的 例 程 。 

给 出 跳跃 表 操作 的 期 望 时 间 为 O( log N) 的 正式 证 明 。 

图 10-74 显示 抛 一 枚 硬币 的 例 程 ， 假 设 rand ik 
一 个 整数 (这 在 许多 系统 中 常见 ) 。 如 果 随 机 数 | enum CotnSide { Heads, Tails 33 
发 生 器 使 用 形 如 M=2" 的 模 (遗憾 的 是 这 在 许多 | coinside 

系统 上 流行 )， 那 么 那些 跳跃 表 算 法 预期 的 性 能 | TPC vere 

如 何 ? eee 

a， 用 取 备 算法 证 明 27 =1(mod 341), "me 

b。 指 出 随机 化 素性 测试 对 于 N=561 并 伴 有 A | ! 

的 多 个 选择 是 如 何 工作 的 。 

实现 收费 公路 重建 算法 。 

如 果 两 个 点 集 产 生 相 同 的 距离 集合 而 不 彼此 转换 ， 那 么 称 这 两 个 点 集 是 同 度 的 (ho- 

mometric), FyIJFERBRAAHATARMN AE: 11, 2, 3, 4, 5, 6, 7, 8, 9, 
10, 11, 12, 13, 16, 17}, RATE. 

扩展 重建 算法 使 给 定 一 个 距离 集合 找 出 所 有 的 同 度 点 集 。 

指出 图 10-75 中 的 树 的 a-B 裁减 的 结 





return Tails; 











图 10-74 有 问题 的 抛 币 器 (程序 ) 


Min 

A Max 
> 

Di ^ Min 


ii P Max 
ddd 


图 10-75 ”博弈 树 ， 该 树 可 以 裁减 


a. 图 10-73 中 的 程序 实现 a 裁减 还 是 B 裁减 ? 

b. 实现 与 其 互补 的 例 程 。 

写 出 三 连 游戏 棋 剩 下 的 过 程 。 

一 维 装 圆 问题 (one-dimensional circle packing problem) 如 下 : 有 N 个 半径 分 别 是 
ry, ro, c, rw 的 圆 。 将 这 些 圆 装 到 一 个 盒子 中 ， 使 得 每 个 圆 都 与 盒子 的 底 边 相 
切 ， 圆 的 排列 按 原 来 的 顺序 。 该 问题 是 找 出 最 小 尺寸 的 盒子 的 宽度 。 图 10-76 显示 
一 个 例子 ， 圆 的 半径 分 别 为 2，1，2。 最 小 尺寸 盒子 的 宽度 为 4 十 4 V2。 

设 无 向 图 G 的 边 满足 三 角形 不 等 式 : cs 十 cow 宇 ci.w。 指 出 如 何 计算 价值 最 多 为 最 
优 路 径 两 倍 的 旅行 售货员 游程 。 提 示 : 构造 最 小 生成 树 。 
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图 10-76 ” 装 圆 问题 实例 


x10. 48 ”假设 你 是 邀请 赛 的 经 理 ， 需 要 安排 N=2' 个 运动 员 间 一 轮 罗 宾 邀 请 赛 (robin tour- 
nament) 。 在 这 次 邀请 赛 上 ， 每 人 每 天 恰好 打 一 场 比赛 ，N 一 1 天 后 ， 每 对 选手 间 均 
已 进行 了 比赛 。 给 出 一 个 递归 算法 安排 比赛 。 

10. 49 xa. 证 明 在 一 轮 罗 宾 邀 请 赛 中 总 能 够 以 顺序 p, ，p;, ，…， 户 .安排 运动 员 使 得 对 所 有 

1«j-N, p, 赢得 对 户 ， 的 比赛 。 
b. 给 出 一 个 O(N log N) 算 法 来 找 出 这 样 的 安排 。 你 的 算法 可 以 作为 上 一 问 (a) 的 证 
明 。 

*10.50 给 定 平面 上 N 个 点 的 集合 P= 二 Pp ，ps，…， \ | r; 
px。 一 个 Voronoi 图 是 将 平面 分 成 N 个 区 域 j 
R, 的 一 个 划分 ,使 得 R; 中 所 有 的 点 都 比 P LN. 
中 任何 其 他 的 点 都 更 接近 pu. E 10-77 显示 7 à 
七 个 (细心 安排 的 ) 点 的 Voronoi 图。 给 出 一 ———{ 。 . y—— 
个 O(N log N) 算 法 构造 Voronoi 图 。 i / 

*10.51. & $ i4 % (convex polygon) 是 具有 如 下 性 质 的 l m 
多 边 形 ; 端点 位 于 多 边 形 上 的 任意 线段 全 部 fo N 
ERS OH. & é (convex hull) 问题 是 / 
找 出 一 个 将 平面 上 的 点 集 围 住 的 (面积 ) 最 小 图 10-77 Voronoi 图 
的 凸 多 边 形 。 图 10-78 显示 40 个 点 的 点 集 的 — 
CR. SHE IS ELS — 4 O(N log N) a 
算法 。 | E 

*10.52 考虑 正确 调整 一 个 段落 的 问题 。 段 落 由 一 系 | 
列 长 度 分 别 为 ai, a2, +, an 的 单词 wi, Erne ce 
w, c. wy 组 成 ,我 们 希望 把 它 破 成 长 度 Roce 
为 工 的 一 些 行 。 单 词 间 由 空白 分 隔 ， 空 白 的 图 10-78 ”一 个 凸 包 的 例子 
理想 长 度 是 六 毫米 ) ， 但 是 空白 在 必要 的 时 候 
可 以 伸 长 或 收缩 (不 过 必须 大 于 0) ， 使 得 一 行 wwii we, 的 长 度 恰好 是 工 。 然 而 ， 
对 于 每 一 处 空白 尹 我 们 要 装填 | 刀 一 和 个 丑 点 (ugliness point)。 不 过 ， 最 后 一 行 是 
BISh, RIRE b <b 的 时 候 装填 ( 换 句 话说 ， 装 填 只 在 收缩 的 时 候 进行 )， 因 为 最 
后 一 行 不 需要 调整 。 这 样 ， 如 果 b 是 在 a; 和 a 之 间 的 空白 的 长 度 ， 那 么 任何 一 











327 


328 


[420] 


数据 结构 与 算法 分 析 C 语言 描述 


x10. 53 


x10. 54 


*10. 55 


x10. 56 


* 10. 57 


行 (最 后 一 行 除外 ) wwi+1…w;(j 之 让 的 丑 点 设置 为 >) lb - 6] — Gilb 一 6|， 


其 中 b' 是 该 行 上 空白 的 平均 大 小 。 这 只 在 b' 过 4b 时 对 最 后 一 行 适 用 ， 否 则 ， 最 后 一 

行 根本 不 必 装 填 丑 点 。 

a. 给 出 一 个 动态 规划 算法 来 找 出 将 ww ，w; ，…，ww 排 成 长 度 为 L 的 一 些 行 的 最 
小 的 丑 点 设置 。 提 示 : T i—N, N—l, =, 1, WR wi, wii, co, wy 的 
最 好 的 排版 方式 。 

b. 给 出 你 的 算法 的 时 间 和 空间 复杂 度 ( 作 为 单词 个 数 N 的 函数 )。 

c. 考虑 我 们 使 用 行 式 打 印 机 而 不 是 激光 打印 机 的 特殊 情况 ,假设 4b 的 最 优 值 为 1 
(空格 ) 。 在 这 种 情况 下 ， 不 允许 空白 收缩 ， 因 为 下 一 个 最 小 的 空白 空间 是 0。 给 
出 一 个 线性 时 间 算 法 在 一 从 行 式 打印 机 上 生成 最 小 的 丑 点 设置 。 

最 长 递增 子 序 列 (longest increasing subsequence) 问题 如 下 : 给 定数 ai, a, - 

an， 找 出 使 得 a, «a; «a, Hi i «ou 的 最 大 的 & 值 。 作 为 一 个 例子 ， 

如 果 输 入 为 3，1，4，1，5，9，2，6，5， 那 么 最 大 递增 子 列 的 长 度 为 4( 该 子 列 为 

1，4，5，9)。 给 出 一 个 O(N? ) 算 法 求解 最 大 递增 子 序列 问题 。 

最 长 公共 子 序 列 (longest common subsequence) 问题 如 下 : 给 定 两 个 序列 Aa, 

a, '*, an MB=b,, bz, cn, bv, RH A 和 B 二 者 共有 的 最 长 子 序列 C=a， 

Co, e a BRKE k. 例如; A i 

A = d,y,n,a,m,i,c 
和 
B= p,r,o,g,r,a,m,m,i,n,g, 

则 最 长 公共 子 序列 为 4,，m， 其 长 度 为 2。 给 出 一 个 算法 求解 最 长 公共 子 序列 问题 。 

你 的 算法 应 该 以 O(MN) 时 间 运 行 。 

字 型 匹配 问题 (pattern matching problem) 如 下 : 给 定 一 个 文本 串 S 和 一 种 字 型 P， 

RH PES 中 的 首次 出 现 。 近 似 字 型 匹配 (approximate pattern matching) 人 允许 三 种 

类 型 

1. 一 个 字符 在 S 中 但 不 在 P 中 。 

2. 一 个 字符 在 P HERES 中 。 

3. P fu S 可 以 在 一 个 位 置 上 不 同 。 

的 有 次 误 匹 配 。 例 如 ， 若 我 们 在 串 “data structures txtborpk” 中 搜索 “textbook” 

允许 最 多 三 次 误 匹 瑟 ， 在 我 们 找到 一 个 匹配 (插入 一 个 e， 将 一 个 r 改变 成 ao， 删除 一 

个 p)。 给 出 一 个 OUMN) 算 法 求解 近似 串 匹 配 问题 ， 其 中 M= | 了 | 以 及 N=|1S|。 

背包 问题 (knapsack problem) 的 一 种 形式 如 下 : 给 定 整数 集合 A=a, a, ocn. an 

和 一 个 整数 K。 存 在 A 的 一 个 其 和 恰好 为 K 的 子 集 吗 ? 

a. 给 出 一 个 算法 以 时 间 O(NK ) 求 解 背包 问题 。 

b. 为 什么 它 不 证 明 P— NP? 

给 你 一 个 货币 系统 ， 它 的 硬币 值 cr, ，c; ，… ，cx 分 以 递减 顺序 排列 。 
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a. 给 出 一 个 算法 计算 找 K 分 零钱 所 需 最 小 的 硬币 数 。 
b. 给 出 一 个 算法 计算 找 K 分 零钱 的 不 同 的 方法 数 。 
x10. 58 ”考虑 将 8 个 皇后 放 到 一 张 (8 行 8 列 的 ) 棋 盘 上 的 问题 。 如 果 两 后 处 在 同一 行 ， 或 同 
一 列 ， 或 同一 条 (不 必 是 主 ) 对 角 线 上 ， 则 称 两 后 是 互相 对 攻 的 。 
a. 给 出 一 个 随机 化 算法 把 8 个 非 攻 击 皇后 放 到 棋盘 上 。 121 
b. 给 出 一 个 回溯 算法 解决 同一 个 问题 。 
c. 实现 这 两 个 算法 并 比较 它们 的 运行 时 间 。 
x10. 59 ”在 国际 象棋 中 ,在 RR 行 C 列 上 的 国王 可 以 走 到 1<R'<B 行 和 1<C'<B 列 (其 中 B 
是 棋盘 的 大 小 ) 处 ， 假 设 要 么 
R=—Rl=2 H IC-C[-1 
要 么 
R=R]=1 E lO-C€1]e$ 
马 的 一 次 环 游 是 马 在 棋盘 上 的 一 系列 跳 行 ， 
它 恰 好 访问 所 有 的 方 格 一 次 最 后 又 回 到 开 | 3Shstance S, T, C) 
{ 





始 的 位 置 。 Distance dr, Tmp; 
a. 如 果 B 是 奇数 ， 证 明 马 的 环 游 不 存在 。 ES T) 
b. 给 出 一 个 回 浏 算法 找 出 马 的 一 次 环 游 。 ee 
10. 60 ERI 10-79 中 的 递归 算法 ， 该 算法 在 一 ae Vertex V adjacent to S 
个 无 圈 图 中 寻找 从 S 到 了 的 最 短 赋 权 a ee ee ee 
路 径 。 TEC p + Tmp « ‘ee 
T= csv + Imp; 
a 这 个 算法 对 于 一 般 的 图 为 什么 行 不 通 ? es 
b. 证 明 该 算法 对 无 圈 图 能 够 终止 。 } 











c. 该 算法 的 最 坏 情 形 运 行 时 间 是 多 少 ? 
10-79 递归 的 最 短路 径 算法 


Q 参考 文献 


Huffman 编码 的 原始 论文 为 [22]。 该 算法 的 各 种 变形 在 文献 [31，34，35] 中 讨论 。 另 一 种 1422 | 
流行 的 压缩 方案 是 Ziv-Lempel 编码 "1 1 。 这 里 的 编码 具有 固定 的 长 度 ， 它 们 代表 串 而 不 是 
字符 。 文 献 [8，36] 是 对 普通 压缩 方案 的 优秀 的 综述 。 

装 箱 问 题 探测 法 分 析 最 初出 现在 Johnson 的 博士 论文 并 在 文献 [23] 中 发 表 。 在 练习 
10. 8 中 给 出 的 联机 装 箱 问题 改进 的 下 界 来 自 论文 [57]; 这 个 结果 在 文献 [37，55] 中 得 到 进 
一 步 的 改进 。 文 献 [49] 则 描述 了 对 联机 装 箱 问题 的 另 一 种 处 理 方法 。 

定理 10.7 取 自 文献 [7]。 最 近 点 算法 出 于 文献 [50]。 文 献 [52] 描 述 了 收费 公路 重建 问 
题 和 它 的 应 用 。 指 数 最 坏 情形 的 输入 由 文献 [59] 给 出 。 在 计算 几何 相对 新 的 领域 中 的 两 本 
老 书 是 文献 [14，45]。 文 献 [41 ，42] 则 包含 一 些 更 新 的 成 果 。 文 献 [2] 包 含 了 在 麻 省 理工 学 
院 所 教 计算 几何 课程 的 讲稿 ， 它 包括 一 个 广泛 的 文献 目录 。 

线性 时 间 选 择 算法 出 自 论文 [9]。 文 献 [17] 讨 论 以 1. 5N 次 期 望 比较 找 出 中 位 数 的 取样 
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方法 。O( N"”) 的 乘法 来 自 文献 [24]。 在 文献 [10，26] 中 讨论 了 若干 推广 。Strassen 算法 出 
自 文献 [53] ， 这 篇 论文 叙述 一 些 结果 ， 此 外 没有 太 多 的 内 容 。Pan[43] 给 出 了 若干 分 治 算 
法 ， 包 括 练习 10. 27 中 的 算法 。 已 知 最 好 的 界 是 ON’), RAT Coppersmith 和 
Winograd[ 13]. 

动态 规划 的 经 典 文献 是 著作 [5，6]。 和 矩阵 排序 问题 最 初 在 文献 [19] 中 研究 。 论 文 [21] 
证 明 该 问题 可 以 以 O(N log NN) 时 间 求 解 。 

Knuth[27] 提 供 一 个 OCN* ) 算 法 构建 最 优 二 又 查找 树 。 所 有 点 对 的 最 短路 径 算法 出 自 
Floyd[16]。 理 论 上 更 好 的 O(N’ (log log N flog N) 2) 算法 由 Fredman[18] 给 出 ， 不 过 它 并 
不 实用 ， 这 倒 没 有 什么 奇怪 。 稍 微 改 进 的 界 ( 指 数 为 1 /2 而 不 是 173) 由 文献 [54] 给 出 ， 相 关 
的 结果 也 见 文献 [3]。 在 某 些 条 件 下 ， 动 态 规划 的 运行 时 间 可 以 自动 地 改进 N 的 一 个 因子 
或 更 多 ， 这 在 练习 10. 33、 论 文 [15，58] 中 都 有 讨论 。 

随机 数 发 生 器 的 讨论 基于 文献 [44]。Park 和 Miller 轻便 的 实现 方法 归 因 于 Schrage 
[51]. BER Pugh 在 文献 [46] 中 讨论 。 另 一 种 类 似 的 结构 即 treap 树 在 第 12 章 讨论 。 随 
机 化 素性 测试 算法 属于 Miller[38] 和 Rabin[48]。A 的 最 多 (N 一 9) /4 个 值 将 会 使 算法 失误 
的 定理 源 于 Monier[39]。 另 外 一 些 随机 化 算法 在 文献 [47] 中 讨论 。 随 机 化 技巧 的 更 多 的 例 
子 可 在 文献 [21，25，40] 中 找到 。 

关于 e 裁减 更 多 的 信息 可 以 查阅 文献 [1，28，29]。 一些 下 国际 象棋 、 西 洋 跳 棋 、 奥 
赛 罗 棋 以 及 十 五 子 棋 的 顶尖 级 的 程序 均 已 达到 世界 等 级 的 状态 。 文 献 [35] 描 述 一 个 奥赛 罗 
棋 的 程序 。 这 篇 论文 出 自 计算 机 游戏 (大 部 分 是 下 棋 ) 专 刊 ， 这 个 专刊 是 思想 的 金 矿 。 其 中 
有 一 篇 论文 描述 当 棋 盘 上 只 有 少数 棋子 的 时 候 使 用 动态 规划 彻底 解决 残局 的 下 法 。 相 关 的 
研究 已 经 导致 在 某 些 情况 下 50 步 规则 的 改变 。 

练习 10. 41 在 文献 [8] 中 解决 。 确 定 没有 重复 距离 的 同 度 (homometric) 点 集 对 于 N>6 
是 否 存在 是 一 个 尚未 解决 的 问题 。Christofides[12] 给 出 了 练习 10. 47 的 一 种 解法 ， 此 外 还 


给 出 一 个 最 多 以 六 倍 的 最 优 时 间 生 成 一 个 游程 的 算法 。 练习 10. 52 在 文献 [30] 中 讨论 。 练 


习 10. 55 在 文献 [56] 中 解决 。 在 文献 [32] 中 给 出 一 个 O(AN) 算 法 。 练 习 10. 57 在 文献 L11] 
中 讨论 ,但 不 要 被 论文 的 标题 所 误导 。 
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在 这 一 章 ， 我 们 将 对 在 第 4 章 和 第 6 章 出 现 的 几 种 高 级 数据 结构 的 运行 时 间 进 行 分 析 ， 
特别 是 我 们 将 考虑 任意 顺序 的 M 次 操作 的 最 坏 情 形 运行 时 间 。 这 与 更 一 般 的 分 析 有 所 不 
同 ， 后 者 是 对 单 次 的 操作 给 出 最 坏 情形 的 时 间 界 。 

例如 ， 我 们 已 经 看 到 AVL 树 以 每 次 操作 O(log N) 最 坏 情形 时 间 支 持 标准 的 树 操 作 。 
AVL 树 在 实现 上 多 少 有 些 复杂 ， 这 不 仅 是 因为 存在 许多 的 情况 ， 而 且 还 因为 高 度 平衡 信息 必 
须 保 存 和 正确 地 更 新 。 使 用 AVL 树 的 原因 在 于 ， 对 非 平衡 查找 树 的 一 系列 ON) HE n RE m 
要 ON ) 时 间 ， 这 样 一 来 花费 就 昂贵 了 。 对 于 查找 树 来 说 ， 一 次 操作 的 OCN) 最 坏 情形 运行 时 
间 并 不 是 真正 的 问题 ， 主 要 的 问题 是 这 种 情形 可 能 反复 发 生 。 伸 展 树 (splay tree) 提 供 一 种 可 喜 
的 方法 ， 虽 然 任 意 操作 仍然 需要 9CN) 时 间 ， 但 是 这 种 退化 行为 不 可 能 反复 发 生 ， 而 且 我 们 可 
以 证 明 ， 任 意 顺 序 的 M 次 操作 (总 共 ) 花 费 OM log N) 最 坏 情 形 时 间 。 因 此 ,在 长 期 运行 中 这 
种 数据 结构 的 行为 就 像 是 每 次 操作 花费 O(log N) 时 间 一 样 。 我 们 把 它 称 为 摊 还 时 间 界 (amor- 
tized time bound) 。 

挫 还 界 比 对 应 的 最 坏 情形 界 弱 ， 因 为 它 对 任意 单 次 操作 提供 不 了 保障 。 由 于 这 个 问 
题 一 般 来 说 并 不 重要 ， 因 此 如 果 能 够 对 一 系列 操作 保持 相同 的 界 同 时 又 简化 数据 结构 ， 
那么 我 们 愿意 牺牲 单 次 操作 的 界 。 摊 还 界 比 等 值 的 平均 情形 界 要 强 。 例 如 ， 二 又 查找 
树 每 次 操作 的 平均 时 间 为 OClog N), 但 是 对 于 连续 M 次 操作 仍然 可 能 花费 OCMND 
时 间 。 

因为 得 到 摊 还 界 需 要 我 们 查看 整个 操作 序列 而 不 是 仅仅 一 次 操作 ， 所 以 我 们 希望 我 们 的 
分 析 更 具 技巧 性 。 我 们 将 看 到 这 种 期 望 一般 会 实现 。 

在 这 一 章 中 ， 我 们 将 : 

e 分 析 二 项 队列 操作 。 

e 分 析 斜 堆 。 

e PAA A Br EA RHE 
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11.1 一 个 无 关 的 智力 问题 


考虑 下 列 问 题 : 将 两 个 小 猫 放 在 足球 场 的 对 面 ， 相 距 100 码 。 它 们 以 每 分 钟 10 码 的 速 
度 相 向 行走 。 同 时 ， 这 两 个 小 猫 的 母亲 在 足球 场 的 一 端 ， 它 可 以 以 每 分 钟 100 码 的 速度 跑 
步 。 猫 妈妈 从 一 个 小 猫 跑 到 男 一 只 小 猫 ， 来 回 轮流 跑 而 速度 不 减 ， 一 直 跑 到 两 个 小 猫 (以 及 
它们 的 猫 妈 妈 ) 在 中 场 相遇 。 问 猫 妈妈 跑 了 多 远 ? 

使 用 蛮 力 计算 不 难 解决 这 个 问题 。 我 们 把 细节 留 给 读者 ， 不过， 预计 这 个 计算 将 涉及 
计算 无 穷 几 何 级 数 的 和 。 pda 但 是 实际 上 通过 引入 一 个 附加 
变量 (即时 间 ) 可 以 得 到 简单 得 多 的 解法 。 

因为 两 个 小 猫 相距 100 码 远 而 且 以 每 分 钟 20 码 的 合 速度 互相 接近 ， 所 以 它们 花 5 分 钟 
即 可 到 达 中 场 。 由 于 猫 妈妈 每 分 钟 跑 100 码 ， 因 此 她 跑 的 总 距离 是 500 码 。 


这 个 问题 阐述 了 一 个 思路 ， 即 有 时 候 间 接 求解 一 个 问题 要 比 直接 求解 容易 。 我 们 将 这 
eee 我 们 将 引入 一 个 附加 变量 ， 叫 作 位 势 (potential)， 有 了 
'. 我们 能 够 证 明 以 前 很 难 证 明 的 一 些 结果 。 


11.2 “项 队列 


我 们 将 要 考察 的 第 一 个 数据 结构 是 第 6 章 中 的 二 项 队列 ， 现 在 进行 简要 的 复习 。 我 们 
知道 ， 二 项 树 B, 是 一 棵 单 节 点 树 ， 且 对 于 R0. —XBI B, 通过 将 两 棵 二 项 树 B, 1 合 并 到 
一 起 而 得 到 。 二 项 树 B 到 B, 如 图 11-1 所 示 。 


? db oa ee. 
dca 


图 11-1 二 项 树 Bo, Bi, Bo, 


一 棵 二 项 树 的 节点 的 秩 (rank) 等 于 它 的 儿子 节点 的 个 数 ， 特 别 地 ，B 的 根 节点 的 秩 为 
k。 二 项 队列 是 堆 序 的 二 项 树 的 集合 ， 在 这 个 集合 中 对 于 m 
任意 的 & 最 多 可 以 存在 一 棵 二 项 树 B,。 图 11-2 显示 两 个 
二 项 队列 H, 和 H. 6) 

最 重要 的 操作 是 Merge( 合 并 )。 为 了 合并 两 个 二 项 从 AM A 
列 ， 需 要 执行 类 似 于 二 进 制 整数 加 法 的 操作 : 在 任意 时 “* 
刻 ， 我 们 可 以 有 零 、 一 、 二 或 可 能 三 棵 B, 树 ， 它 依赖 于 °63) 
这 两 个 优先 队列 是 否 包含 一 棵 B 树 以 及 是 否 有 一 棵 B, 树 
从 前 一 步 转 入 。 如 果 存 在 零 棵 或 一 棵 B, 树 ， 那 么 它 作为 
一 棵 树 放 到 合并 后 的 二 项 队列 中 ;， 如果 有 两 棵 B 树 ， 那 么 它们 被 合并 成 一 棵 B;, 树 并 且 并 
入 结果 中 ; 如 果 有 三 棵 By 树 ， 那 么 将 一 棵 作为 树 放 入 二 项 队列 中 而 另 两 棵 则 合并 成 一 棵 且 
并 入 结果 中 。 和 A, 合并 的 结果 如 图 11-3 所 示 。 

插入 操作 通过 创建 一 个 单 节点 二 项 队列 并 执行 一 次 Merge 来 完成 。 做 这 项 工作 所 用 的 
时 间 为 M 十 1， 其 中 M 代表 不 在 该 二 项 队列 中 的 二 项 树 Bu 的 最 小 型 号 。 因 此 ， 向 一 个 有 一 
棵 B, 树 但 没有 By 树 的 二 项 队列 进行 的 插入 操作 需要 两 步 。 删 除 最 小 元 通过 把 最 小 元 除去 
并 将 原 二 项 队列 分 裂 成 两 个 二 项 队列 ， 然 后 再 将 它们 合并 来 完成 。 第 6 章 给 出 了 对 这 些 操 


图 11-2 两 个 二 项 队列 H, $0 H 
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作 的 比较 详细 的 解释 。 
$1 = 21) 24)  —(4 Pa 
65) E SRO 
T) 


B] 11-3 二 项 队列 H3: 合并 H MH. HAR 


我 们 首先 考虑 一 个 非常 简单 的 问题 。 假 设 我 们 想 要 建立 一 个 含有 N 个 元 素 的 二 项 队 
列 。 我 们 知道 ， 建 立 一 个 含有 N 个 元 素 的 二 叉 堆 可 以 以 OCN) 时 间 完 成 ， 因 此 我 们 希望 对 
于 二 项 队列 也 有 一 个 类 似 的 界 。 

声明 : 

N 个 元 素 的 二 项 队列 可 以 通过 N 次 相继 插入 而 以 OCN) 时 间 建 成 。 

这 个 声明 如 果 成 立 ， 那 么 它 就 给 出 一 个 极其 简单 的 算法 。 由 于 每 次 插入 的 最 坏 情形 时 
HÆ OClog N)， 因 此 ， 这 个 声明 是 否 成 立 并 不 是 显然 的 。 考 虑 到 如 果 将 该 算法 应 用 到 二 又 
堆 ， 则 运行 时 间 将 是 O(N log ND. 

要 想 证 明 这 个 声明 ， 我 们 可 以 直接 进行 计算 。 为 了 测 出 运行 时 间 ， 我 们 将 每 次 插入 
的 代价 定义 为 一 个 时 间 单 位 加 上 每 一 步 链接 的 一 个 附加 单位 。 将 所 有 插入 的 时 间 代 价 求 
和 就 得 到 总 的 运行 时 间 。 这 个 总 的 时 间 为 N 个 单位 加 上 总 的 链接 步 数 。 第 一 、 第 三 、 第 
五 以 及 所 有 编号 为 奇数 的 步 不 需要 链接 ， 因 为 在 插入 时 B, 不 出 现 。 因 此 ， 有 一 半 的 插 
入 不 需要 链接 ， 四 分 之 一 的 插入 只 需要 一 次 链接 (第 二 、 第 六 、 第 十 次 插入 等 等 )， 八 
分 之 一 的 插入 需要 两 次 链接 ， 等 等 。 我们 可 以 把 所 有 这 些 加 起 来 并 确定 用 N 作为 链接 
步 数 的 界 ， 从 而 证 明 该 声明 。 不 过 ， 当 我 们 试图 分 析 一 系列 不 仅仅 是 插入 的 操作 的 时 
候 ， 这 种 蛮 力 计算 将 无 助 于 其 后 的 进一步 分 析 ， 因 此 我 们 将 使 用 另外 一 种 方法 来 证 明 
这 个 结果 。 

考虑 一 次 插入 的 结果 。 如 果 在 插入 时 不 出 现 Bs 树 ， 那 么 使 用 与 上 面相 同 的 计数 方法 可 
知 这 次 插入 的 总 代价 是 一 个 时 间 单 位 。 现 在 ,插入 的 结果 有 了 一 棵 B. 树 ， 这 样 ， 我们 已 经 
把 一 棵 树 添加 到 二 项 树 的 森林 中 。 如 果 存 在 一 棵 B, 树 但 是 没有 B, 树 ， 那 么 插入 花费 两 个 
单元 的 时 间 。 新 的 森林 将 有 一 棵 Bi 树 但 不 再 有 B. 树 ， 因 此 在 森林 中 树 的 数目 并 没有 变化 。 
花费 三 个 单元 时 间 的 一 次 插入 将 创建 一 棵 B. 树 但 消除 一 棵 Bo AB, 树 ， 这 导致 在 森林 中 净 
减少 一 棵 树 。 事 实 上 ， 容 易 看 到 ， 一 般 说 来 花费 c 个 单元 时 间 的 一 次 插入 导致 在 森林 中 净 
增加 2 一 c 棵 树 ， 这 是 因为 创建 了 一 棵 B._1 树 而 消除 了 所 有 的 B: 树 ，0 过 i 二 c 一 1。 因 此 , fX 
价 昂贵 的 插入 操作 删除 一 些 树 ， 而 低廉 的 插入 却 创建 一 些 树 。 

4 C, 是 第 i 次 插入 的 代价 。 令 T; 为 第 i 次 插入 后 的 树 的 棵 数 。T =0 为 树 的 初始 棵 
数 。 此 时 我 们 得 到 不 变 式 

C; -(IT;—T,) =2 01.1) 
Fz 
C,+(T, —T)= 2 


Cat CTs =T= 2 


Cra + CT y-1 — Ty-2) = 2 
Cy + (Ty — Tx) = 2 
把 这 些 方程 都 加 起 来 ， 则 大 部 分 的 T, 项 被 消去 ， 最 后 剩 下 


yc + Ty —T, =2N 
或 等 价 地 ， i 
yc = 2N—(Ty—T)) 
考虑 到 T, —0 URN HAL AJ A Ty 确实 非 负 ， 因 此 (Ty 一 T,) 非 负 。 于 是 


SC <2N 
这 就 证 明了 我 们 的 声明 。 

在 BuildBinomialQueue 例 程 运行 期 间 ， 每 一 次 插入 有 一 个 最 坏 情形 运行 时 间 
O(log N)， 但 是 由 于 整个 例 程 最 多 用 到 2N 个 单位 的 时 间 ， 因 此 这 些 插入 的 行为 就 像 是 每 
次 使 用 不 多 于 两 个 单位 的 时 间 。 

这 个 例子 阐明 了 我 们 将 要 使 用 的 一 般 技 巧 。 数 据 结构 在 任意 时 刻 的 状态 由 一 个 称 为 位 
势 的 函数 给 出 。 这 个 位 势 函 数 不 由 程序 保存 ， 而 是 一 个 计数 装置 ， 该 装置 将 帮助 进行 分 析 。 
当 一 些 操作 花费 少 于 我 们 允许 它们 使 用 的 时 间 时 ， 则 没有 用 到 的 时 间 就 以 一 个 更 高 位 势 的 
形式 “存储 ”起 来 。 在 我 们 的 例子 中 ， 数 据 结 构 的 位 势 就 是 树 的 棵 数 。 在 上 面 的 分 析 中 ， 
当 我 们 有 一 些 插入 只 用 到 一 个 单位 而 不 是 规定 的 两 个 单位 的 时 候 ， 则 这 个 额外 的 单位 通过 
增加 位 势 而 被 存储 起 来 以 备 其 后 使 用 。 当 操作 出 现 超出 规定 的 时 间 时 ， 则 超出 的 时 间 通 过 
位 势 的 减少 来 计算 。 可 以 把 位 势 看 作 一 个 储蓄 账户 。 如 果 一 次 操作 使 用 了 少 于 指定 的 时 间 ， 
那么 这 个 差额 就 被 存储 起 来 以 备 后 面 更 昂贵 的 操作 使 用 。 图 11-4 显示 由 BuildBinomi- 
alQueue 对 一 系列 插入 操作 所 使 用 的 累积 的 运行 时 间 。 可 以 看 到 ， 运 行 时 间 从 不 超过 2N， 
而 且 在 任意 一 次 插入 后 二 项 队列 中 的 位 势 计量 着 存储 量 。 

一 旦 位 势 函 数 被 选 定 ， 我们 就 可 写 出 主要 的 方程 : 

Tw + APotential = Tomortized (11. 2) 
Te 是 一 次 操作 的 实际 时 间 ， 代 表 需 要 执行 一 次 特定 操作 需要 的 精确 (遵守 的 ) 时 间 量 。 例 
如 在 二 又 查找 树 中 ， 执 行 一 次 Fina(CX) 的 实际 时 间 是 1 加 上 包含 X 的 节点 的 深度 。 如 果 我 
们 对 整个 序列 把 基本 方程 加 起 来 ， 并 且 最 后 的 位 势 至 少 像 初始 位 势 一 样 大 ,那么 摊 还 时 间 
就 是 在 操作 序列 执行 期 间 所 用 到 的 实际 时 间 的 一 个 上 界 。 注 意 ， 当 Te 在 从 一 个 操作 到 另 
一 操作 变化 时 ，Tnoua 却 是 稳定 的 。 

选择 一 个 位 势 函 数 以 确保 一 个 有 意义 的 界 是 一 项 艰难 的 工作 ,不 存在 一 种 实用 的 方法 。 
一 般 来 说 ， 在 尝试 过 许多 位 势 函 数 以 后 才能 够 找到 一 个 合适 的 函数 。 不 过 ， 上 面 的 讨论 提 
出 一 些 法 则 ， 这 些 法 则 告诉 我 们 好 的 位 势 函数 所 具有 的 一 些 性 质 。 位 势 函 数 应 该 : 
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图 11-4 连续 N 次 插入 


e 总 假设 它 的 最 小 元 位 于 操作 序列 的 开始 处 。 选 择 位 势 函 数 的 一 种 常用 方法 是 保证 位 
势 函 数 初始 值 为 0， 而 且 总 是 非 负 的 。 我 们 将 要 遇 到 的 所 有 例子 都 使 用 这 种 方法 。 

e 消去 实际 时 间 中 的 一 项 。 在 我 们 的 例子 中 ， 如 果实 际 的 花费 是 <， 那么 位 势 改变 为 
2 一 c。 当 把 这 些 加 起 来 就 得 到 挫 还 花费 是 2， 如 图 11-5 所 示 。 


; 插入 的 花费 


-4 位 势 变化 


0 4 8 12 16 20 24 28 32 36 40 44 48 


图 11-5. 在 一 系列 操作 中 插入 的 花费 和 每 一 次 操作 的 位 势 变 化 





431| 现在 我 们 可 以 对 二 项 队列 操作 进行 完整 的 分 析 。 
定理 11.1 Insert, DeleteMin 以 及 Merge 对 于 二 项 队列 的 挫 还 运行 时 间 分 别 是 


O(1)、 O(log N)# O(log ND, 

证 明 : 位 势 函 数 是 树 的 棵 数 。 初 始 的 位 势 函 数 为 0， 且 位 势 总 是 非 负 的 ， 因 此 挫 还 时 间 
是 实际 时 间 的 一 个 上 界 。 对 Insert 的 分 析 从 上 面 的 论证 可 以 得 到 。 对 于 Merge. 假设 两 
棵 树 分 别 有 N; AN, 个 节点 以 及 对 应 的 T, RIT; 棵 树 。 令 N— Ni 十 N,。 执 行 合 并 的 实际 
时 间 为 OClog(N, ) +log(N,))=OCog N)。 在 合并 之 后 ， 最 多 可 能 存在 log N 棵 树 ， 因 此 
位 势 最 多 可 以 增加 O(log N)。 这 就 给 出 一 个 挫 还 的 界 O(log N). DeleteMin 的 界 可 用 类 
似 的 方法 得 到 。 


11.3 HE 


二 项 队列 的 分 析 可 以 算是 一 个 容易 的 摊 还 分 析 实 例 。 现 在 我 们 来 考察 斜 堆 。 像 许多 的 
例子 一 样 ， 一旦 找到 正确 的 位 势 函 数 ,， 分 析 起 来 就 容易 了。 困难 的 问题 是 选择 一 个 合适 的 
fo: 35 PA BL 

REP RHE. FRAN A EPR EE OF. AIR HE. ATE E 08945 REA 
并 并 使 之 成 为 新 的 左 路 径 。 对 于 新 路 径 上 的 每 一 个 节点 ， 除 去 最 后 一 个 ， 老 的 左 子 树 作为 
右 子 树 而 附 于 其 上 。 在 新 的 左 路 径 上 的 最 后 节点 已 知 没有 右 子 树 ， 因 此 给 它 一 棵 右 子 树 就 
不 明智 了 。 我 们 所 要 考虑 的 界 不 依赖 于 这 个 例外 ， 如 果 例 程 是 递归 地 编写 的 ， 那 么 这 又 是 
自然 要 发 生 的 情况 。 图 11-6 显示 合并 两 个 斜 堆 后 的 结果 。 


图 11-6 合并 两 个 斜 堆 


设 我 们 有 两 个 斜 堆 H, 和 H: FER AWARE EAA n Mr 个 节点 。 此 时 ， 执 行 
合并 的 实际 时 间 与 nns 成 正比 ， 因 此 我 们 将 省 去 大 O 记号 而 对 右 路 径 上 的 每 一 个 节点 取 
一 个 单位 的 时 间 。 由 于 这 些 堆 没 有 固定 的 结构 模式 ， 因 此 两 个 堆 的 所 有 节点 都 位 于 右 路 径 
上 的 情况 是 可 能 发 生 的 ， 而 这 将 给 出 合并 两 个 堆 的 最 坏 情 形 的 界 ON) (练习 11. 3 要 求 构 造 
一 个 例子 ) 。 我 们 将 证 明 合并 两 个 斜 堆 的 挫 还 时 间 为 O(log N). 

我 们 需要 的 是 能 够 获得 斜 堆 操 作 效 果 的 某 种 类 型 的 位 势 函 数 。 我 们 知道 ， 一 次 合并 的 
效果 是 处 在 右 路 径 上 的 每 一 个 节点 都 被 移 到 左 路 径 上 ， 而 其 原 左 儿 子 变 成 新 的 右 儿子 。 一 
种 想法 是 把 每 一 个 节点 算 入 为 右 节点 或 左 节点 来 分 类 ， 这 要 看 节点 是 右 儿子 还 是 不 是 右 儿 
子 来 定 ， 这 时 我 们 把 右 节 点 的 个 数 作为 位 势 函 数 。 虽 然 位 势 初始 时 为 0 并 且 总 是 非 负 的 ， 
但 是 问题 在 于 这 种 位 势 在 一 次 合并 后 并 不 减少 从 而 不 能 恰当 地 反映 在 数据 结构 中 的 储备 量 。 
这 样 的 结果 使 该 位 势 函 数 不 能 够 用 来 证 明 所 要 求 的 界 。 


一 个 类 似 的 想法 是 把 节点 分 成 重 节 点 或 轻 节点 ， 这 要 看 任意 节点 的 右 子 树 上 的 节点 是 
否 比 左 子 树 上 的 节点 多 来 确定 。 


EX: 一 个 节点 p 如 果 其 右 子 树 的 后 背 数 至 少 是 该 p Be fi OR B. WERT S p 

是 重 的 ， 和 否则 称 之 为 轻 的 。 注 意 ， 一 个 节点 的 后 裔 个 数 包括 该 节点 本 身 。 

例如 ， 图 11-7 表示 一 个 斜 堆 。 关 键 字 为 15、3、6、12 和 7 的 节点 是 重 节点 ， 而 所 有 其 
他 的 节点 都 是 轻 节 点 。 

我 们 将 要 使 用 的 位 势 函数 是 这 些 堆 ( 的 集合 ) 中 的 重 节 点 的 个 数 。 看 起 来 这 可 能 是 一 种 
好 的 选择 ， 因 为 一 条 长 的 右 路 径 将 包含 非常 多 的 重 节 点 。 由 于 这 条 路 径 上 的 节点 将 要 交换 
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它们 的 子 节 点 ， 因 此 这 些 节 点 将 被 转变 成 合并 结果 中 的 轻 节 点 
X 
(3) (6) 
2 
20 — (M) 12 (7 
23) as AAN E 
33 25 (18 


26) 
图 11-7” 斜 堆 一 一 其 中 的 重 节 点 是 3、6、7、12 和 15 


定理 11.2 合并 两 个 斜 堆 的 摊 还 时 间 为 O(log ND, 

证 明 : $ H, HI H, 为 两 个 堆 ， na Ni 和 NN; RA AR. w H 的 右 路 径 有 个 轻 
节点 和 万 CETA, HA Lth 个 . IR. Ho, 在 其 右 路 径 上 有 ii PRIAM h 个 重 
PA, HAL th, 个 节点 

如 果 我 们 采用 约定 : fe JR BIS BUR UU HE UR 它们 右 路 径 上 节点 的 总 数 ， 那 么 执行 合 
并 的 实际 时 间 就 是 4 十 ls 十 hi 十 hs。。 现 在 ， 其 重 / 轻 状态 能 够 改变 的 节点 只 是 那些 最 初 位 
于 右 路 径 上 (并 最 后 出 现在 左 路 径 上 ) 的 节点 ， 因 为 再 没有 别 的 节点 的 子 树 被 交换 ， 见 
图 11-8. 
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图 11-8 合并 后 重 / 轻 状态 的 变化 


如 果 一 个 重 节点 最 初 是 在 右 路 径 上 ， 那 么 在 合并 后 它 必然 成 为 一 个 轻 节点 。 位 于 右 路 
径 上 的 其 余 那 些 节 点 是 轻 节点 ， 它们 可 能 变 成 也 可 能 不 变 成 重 节 点 , 但 是 由 于 我 们 要 证 明 
一 个 上 界 ， 因 此 必须 假设 最 坏 的 情况 ， 即 它们 都 变 成 了 重 节点 并 使 得 位 势 增 加 。 此 时 ， 重 
节点 个 数 的 净 变 化 最 多 为 4 十 ls 一 hi 一 h,。 把 实际 时 间 和 位 势 的 变化 ( 式 (11.2)) 加 起 来 则 得 
到 一 个 挫 还 界 2(7 e). 

现在 我 们 必须 证 明 4 7-4 二 O(log NO, BF. h AL 是 原 右 路 径 上 轻 节点 的 个 数 ， 而 一 
个 轻 节 点 的 右 子 树 小 于 以 该 轻 节 点 为 根 的 树 的 大 小 的 一 半 ， 由 此 直接 推出 右 路 径 上 轻 节 点 
的 个 数 最 多 为 log Ni 十 log N,， 这 就 是 O(log N). 

注意 ， 初 始 的 位 势 为 0 而 且 位 势 总 是 非 负 的 ,我 们 的 证 明 也 就 完成 了 。 验 证 这 一 点 很 
重要 ,否则 挫 还 时 间 就 不 能 成 为 实际 时 间 的 界 而 且 也 就 没有 意义 了 。 
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由 于 Insert 和 DeleteMin 操作 基本 上 就 是 一 些 Merge. 它们 的 挫 还 界 也 是 O(log ND, 


11.4 XE HE 


在 9.3. 2 节 我 们 指出 如 何 使 用 优先 队列 改进 Dijkstra 最 短路 径 算法 的 粗略 运行 时 间 
O(C|V|:)。 重 要 的 现象 是 运行 时 间 被 | 已 | 次 DecreaseKey 操作 和 |V| 次 Insert 和 Delete- 
Min 操作 所 控制 。 这 些 操作 发 生 在 大 小 最 多 为 |V | 的 集合 上 。 通 过 使 用 二 又 堆 ， 所 有 这 些 操 
作 花 费 O(log|VY|) 时 间 ， 因 此 Dijkstra 算法 最 后 的 界 可 以 减 到 OC | E | log | V |). 

为 了 降低 这 个 时 间 界 ， 必 须 改 进 执行 Decreasekey 操作 所 需要 的 时 间 。 我 们 在 6.5 
节 所 描述 的 d- HESS HH XT DecreaseKey 以 及 Insert 操作 的 Ooga | V | ) 时 间 界 ， 但 对 
DeleteMin 的 界 却 是 O(d log, | V | )。 通 过 选择 d 来 平衡 带 有 |V | 次 DeleteMin 操作 的 
|E| 次 DecreaseKey 操作 的 花费 ， 并 考虑 到 d 必须 总 是 至 少 为 2， 那 么 我 们 看 到 d 的 一 个 
好 的 选择 是 

d = max(2,L/E|/|V|) 
它 把 Dijkstra 算法 的 时 间 界 改进 到 
OC| E|logeigiivip I VI? 

3E US JE S ME Ji VL O(1) 摊 还 时 间 支 持 所 有 基本 的 堆 操作 的 一 种 数据 结构 ， 但 Delete- 
Min 和 Delete 除外 ， 它 们 花费 O(log N) 的 摊 还 时 间 。 我 们 立即 得 出 ， 在 Dijkstra 算法 中 
的 那些 堆 操 作 将 总 共 需 要 O E| + [Vlog |V|) 的 时 间 。 

斐 波 那 契 堆 (Fibonacci heap) © 通过 添加 两 个 新 的 观念 推广 了 二 又 堆 : 

® DecreaseKey 的 一 种 不 同 的 实现 方法 : 我 们 以 前 看 到 的 那 种 方法 是 把 元 素 朝 向 根 节 
点 上 滤 。 对 于 这 种 方法 似乎 没有 理由 期 望 O(1) 的 摊 还 时 间 界 ， 因 此 需要 一 种 新 的 
HK. 
懒惰 合并 (lazy merging): 只 有 当 两 个 堆 需 要 合并 时 才 进 行 合 并 。 这 类 似 于 懒惰 删 
除 。 对 于 懒惰 合并 ，Merge 是 低廉 的 ， 但 是 因为 懒惰 合并 并 不 实际 把 树 结合 在 一 起 ， 
所 以 DeleteMin 操作 可 能 会 遇 到 许多 的 树 ， 从 而 使 这 种 操作 的 代价 高 晶 。 任 何 一 次 
DeleteMin 都 可 能 花费 线性 时 间 ， 但 是 总 能 够 把 时 间 归 和 钻 到 前 面 的 一 些 Merge 操 
作 中 去 。 特 别 地 ， 一 次 昂贵 的 DeleteMin 必须 在 其 前 面 要 有 大 量 的 非常 低廉 的 
Merge 操作 ， 它 们 能 够 储存 额外 的 位 势 。 


11.4.1 切除 左 式 堆 中 的 节点 


在 二 叉 堆 中 ，DecreaseKey 操作 是 通过 降低 节点 的 值 然 后 将 其 朝 着 根 上 滤 直 到 建成 堆 
序 来 实现 的 。 在 最 坏 的 情形 下 ， 它 花费 O(log N) 时 间 ， 这 是 平衡 树 中 通 向 根 的 最 长 路 径 
的 长 。 

如 果 代 表 优先 队列 的 树 不 具有 O(log N) 的 深度 ， 那 么 这 种 方法 不 适用 。 例 如 ， 若 将 这 





日 ”这 个 名 字 来 自 于 这 种 数据 结构 的 一 个 性 质 ， 后 面 我 们 要 在 本 节 证 明 它 。 
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种 方法 用 于 左 式 堆 ， 则 DecreaseKey 操作 可 能 花费 @(N) 时 间 ， 如 图 11-9 所 示 。 
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11-9. 通过 上 滤 将 N— 138732) OB O(N) A) 
我 们 看 到 ， 对 于 左 式 堆 来 说 DecreaseKey 操 作 需 要 另外 的 方法 ， 见 图 11-10 中 的 左 式 


堆 。 假 设 我 们 想 要 将 值 为 9 的 关键 字 减 低 到 0。 车 对 该 堆 变 动 ， 则 必 将 引起 堆 序 的 破坏 ， 这 
种 破坏 在 图 11-11 中 用 虚线 标示 。 
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图 11-11 将 9 降 到 0 引起 堆 序 的 破坏 


我 们 不 想 把 0 上 滤 到 根 ， 因 为 正如 我 们 已 经 看 到 的 ， 存 在 一 些 情况 使 得 这 样 做 代价 太 大 。 
解决 的 办 法 是 把 堆 沿 着 虚线 切 开 ， 如 此 得 到 两 棵 树 ， 然 后 再 把 这 两 棵 树 合 并 成 一 棵 。 令 X 为 
要 执行 DecreaseKey 操作 的 节点 ， 令 尸 为 它 的 父 节点 。 在 切断 以 后 我 们 得 到 两 棵 树 ， 即 根 为 
XX 的 于 MT, T: 是 原来 的 树 除去 Ha 后 得 到 的 树 。 具 体 情 况 如 图 11-12 所 示 。 

如 果 这 两 棵 树 都 是 左 式 堆 ， 那 么 它们 可 以 以 时 间 O(log N) 合 并 ， 整 个 操作 也 就 完成 
T. RDA., H 是 左 式 堆 ， 因 为 没有 节点 的 后 裔 发 生变 化 。 由 于 它 的 所 有 节点 原本 就 满 
足 左 式 堆 的 性 质 ， 因 此 现在 仍 将 必然 满足 。 
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图 11-12 切断 之 后 得 到 的 两 棵 树 
然而 ， 这 种 方案 似乎 还 是 行 不 通 ， 因 为 T 未 必 是 左 式 堆 。 不 过 ， 容 易 恢复 左 式 堆 的 性 


质 ， 这 要 用 到 下 列 两 个 观察 到 的 结论 : 
e RAM P BT. 的 根 的 路 径 上 的 节点 可 能 破坏 左 式 堆 的 性 质 ， 它 们 可 以 通过 交换 子 


节点 来 调整 。 
e 由 于 最 大 右 路 径 长 最 多 有 | log(N 十 1)] 个 节点 ， 因 此 我 们 只 需 检 查 从 了 到 的 根 的 路 


径 上 的 前 | log(N 十 1)] 个 节点 。 图 11-13 显示 了 Hi 和 将 T, 转变 成 左 式 堆 后 的 HD. 
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11-13. 38 T; 转变 成 左 式 堆 H; 后 的 情形 


因为 我 们 能 够 以 O(log N) 步 将 T: 转变 成 左 式 堆 H, MIRAI Hi 和 Ho. ， 所 以 我 们 得 到 
一 个 在 左 式 堆 中 执行 DecreaseKey 的 O(log N) 算 法 。 图 11-14 显示 的 堆 是 该 例 的 最 后 结果 。 
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图 11-14 通过 合并 H, 和 H 而 完成 操作 Decreasekey(H, X, 9) 


11.4.2 二 项 队列 的 懒惰 合 
由 斐 波 那 契 堆 所 使 用 的 第 二 个 想法 是 懒惰 合并 (lazy merging)。 我 们 将 把 这 个 想法 用 于 


二 项 队列 并 证 明 执 行 一 次 Merge 操作 (还 有 插入 操作 ， 它 是 一 种 特殊 情形 ) 的 挫 还 时 间 为 
O(1)。 对 于 DeleteMin， 其 挫 还 时 间 仍 然 是 O(log ND, 

这 个 想法 如 下 : web 只 要 把 两 个 二 项 树 的 表 连 在 一 起 ， 结 果 得 到 

一 个 新 的 二 项 队列 。 这 个 新 的 二 项 队列 可 能 含有 相同 大 小 的 多 棵 树 ， 因 此 破坏 二 项 队列 的 

性 质 。 pe 我 们 将 把 它 叫 作 懒 惰 二 项 队列 (lazy binomial queue)。 这 是 一 种 快 

速 操作 ， 该 操作 总 是 花费 常数 (最 坏 情形 ) 时 间 。 和 前 面 一 样 ， 一 次 插入 通过 创建 一 个 单 节 
点 二 项 队列 并 将 其 合并 而 完成 。 区 别 在 于 合并 是 懒惰 的 。 

DeleteMin 操作 要 麻烦 得 多 ， 因 为 此 处 需要 我 们 最 终 把 懒惰 二 项 队列 转变 回 到 标准 的 
二 项 队列 ， 不 过 ， 正 如 我 们 将 要 证 明 的 ， 它 仍然 花费 O(log N) 的 摊 还 时 间 一 一 而 不 像 以 前 
是 O(log N) 最 坏 情 形 时 间 。 为 了 执行 DeleteMin， 我 们 找 出 (并 最 终 返 回 ) 最 小 元 素 。 如 
前 所 述 ， 我 们 将 它 从 队列 中 删除 ， 使 得 它 的 每 一 个 子 节 点 都 成 为 一 棵 新 的 树 。 此 时 我 们 通 
过 合并 两 棵 相等 大 小 的 树 直 至 不 再 可 能 合并 为 止 而 把 所 有 的 树 合并 成 一 个 二 项 队列 。 

例如 ， 图 11-15 表示 一 个 懒惰 二 项 队列 。 在 一 个 懒惰 二 项 队列 中 ， 可 能 有 多 于 一 棵 的 树 有 相 
同 的 大 小 。 为 了 执行 DeleteMin， 我 们 照 以 前 那样 把 最 小 的 元 素 删除 ， 并 得 到 图 11-16 中 的 树 。 
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图 11-16 在 删除 最 小 元 素 (3) 后 的 懒惰 二 项 队列 


现在 我 们 必须 将 所 有 的 树 合 并 而 得 到 一 个 标准 的 二 项 队列 。 一 个 标准 的 二 项 队列 每 个 
秩 上 最 多 有 一 棵 树 。 为 了 有 效 地 进行 这 项 工作 ， 我 们 必须 能 够 以 正比 于 出 现在 工 中 树 的 棵 
数 的 时 间 (或 log N， 哪 个 大 用 哪个 ) 完 成 Merge. Hik, 我们 构造 表 的 一 个 数组 : Lo. 
Lys ts Le oo Er Re 是 最 大 的 树 的 秩 。 每 个 表 La 包含 秩 为 R 的 所 有 的 树 。 然 后 应 用 
图 11-17 中 的 过 程 。 

每 执行 一 次 过 程 中 从 第 3 一 5 行 的 循环 ， 树 的 总 棵 数 都 要 减少 1。 这 意味 着 ， 这 部 分 每 
次 执行 都 花费 常数 时 间 的 代码 只 能 够 
执行 了 一 1 次 ， 其 中 了 是 树 的 棵 数 。 /* 1*/ for(R = 0; R <= [log NJ; Re« ) 
XR for GAM while XR | Oe el mie 
未 尾 的 检测 花费 O(log N) 时 间 ， 这 使 | ^. as) Eu ee Re D emisti 
得 运行 时 间 成 为 所 要 求 的 OCT +log /* 5*/ Add the new tree to [g.1; 
N). Bl 11-18 显示 该 算法 对 前 面 二 项 
队列 的 集合 的 执行 情况 。 11-17 恢复 二 项 队列 的 过 各 
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图 11-18 ”把 一 些 二 项 树 合并 成 一 个 二 项 队列 


懒惰 二 项 队列 的 摊 还 分 析 

为 了 进行 懒惰 二 项 队列 的 挫 还 分 析 ， 我 们 将 用 到 对 标准 二 项 队列 所 使 用 的 相同 的 位 势 
函数 。 因 此 ， 懒 惰 二 项 队列 的 位 势 是 树 的 棵 数 。 

定理 11.3 Merge 和 Insert 的 摊 还 运行 时 间 对 于 懒惰 二 项 队列 均 为 OCD , Delete- 
Min 的 摊 还 运行 时 间 为 O(log ND, 

证 明 : 这 里 的 位 势 函 数 为 二 项 队列 集合 中 树 的 棵 数 。 初 始 的 位 势 为 0， 而 且 位 势 总 是 非 
负 的 。 因 此 ， 经 过 一 系列 的 操作 之 后 ， 总 的 摊 还 时 间 是 总 的 运行 时 间 的 一 个 上 界 。 

对 于 Merge 操作 ， 实 际 时 间 为 常数 ， 而 二 项 队列 的 集合 中 树 的 棵 数 是 不 变 的 ， 因 此 ， 
由 式 (11.2) 可 知 摊 还 时 间 为 OC1) 。 

对 于 Insert 操作 ， 其 实际 时 间 是 常数 ， 而 树 的 棵 数 最 多 增加 1， 因 此 摊 还 时 间 为 
OCD, 。 操 作 DeleteMin 比较 复杂 。 令 R 为 包含 最 小 元 素 的 树 的 秩 ， 而 令 工 是 树 的 棵 数 。 
于 是 ,在 DeleteMin 操作 开始 时 的 位 势 为 工 。 为 执行 一 次 DeleteMin， 最 小 节点 的 各 子 
节点 被 分 离开 而 成 为 一 棵 一 棵 的 树 。 这 就 产生 了 TOR 棵 树 ， 这 些 树 必 须要 合并 成 一 个 标 
准 的 二 项 队列 。 如 果 忽 略 大 O 记号 中 的 常数 ， 那 么 根据 上 面 的 论述 可 知 ， 执 行 该 操作 的 实 
际 时 间 为 T+R+log NS 。 另 一 方面 ,一 旦 做 完 这 些 ， 剩 下 的 最 多 可 能 还 有 log N RM, 
因此 位 势 函 数 最 多 可 能 增加 (log N) 一 工 。 把 实际 时 间 和 位 势 的 变化 加 起 来 得 到 摊 还 时 间 界 
为 2 log N 十 R。 由 于 所 有 的 树 都 是 二 项 树 ， 因 此 我 们 知道 R<log N。 这 样 ， 我 们 得 到 
DeleteMin 操作 的 摊 还 时 间 界 O(log ND, 


四 ”我们 能 够 这 么 做 是 因为 我 们 可 以 把 大 O 记 号 所 蕴含 的 常数 置信 位 势 函 数 并 仍 可 消去 这 些 项 ， 这 在 该 证 明 中 是 
需要 的 。 
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11.4.3 SEiRABRERIF 


TE 4X (1) Bü mu FE BAY, 3E JEU R EK AE RHE Decreasekey 操作 与 懒惰 二 项 队列 
Merge 操作 结合 起 来 。 不 过 ， 我 们 不 能 一 点 修改 也 不 做 而 使 用 这 两 种 操作 。 问 题 在 于 ， 如 
果 在 这 些 二 项 树 中 进行 任意 切割 ， 那 么 结果 得 到 的 森林 将 不 再 是 二 项 树 的 集合 。 因 此 ， 每 
一 棵 树 的 秩 最 多 为 | log N 将 不 再 成 立 。 由 于 已 证 明 在 懒惰 二 项 队列 中 DeleteMin AY PER 
时 间 是 2 log N 十 R， 因 此 ， 对 于 DeleteMin 的 界 我 们 需要 R=OClog N) 成 立 。 

Hj T (RIE R=OCog N), 我 们 对 所 有 的 非 根 节点 应 用 下 述 法 则 : 

e 将 第 一 次 (因为 切除 而 ) 失 去 一 个 子 节点 的 ( 非 根 ) 节 点 做 上 标记 。 

e 如 果 被 标记 的 节点 又 失去 另外 一 个 儿子 节点 ， 那 么 将 其 从 它 的 父 节点 切除 。 这 个 节 

点 现在 变 成 了 一 棵 分 离 的 树 的 根 并 且 不 再 被 标记 。 这 叫 作 一 次 级 联 切除 (cascading 
cut) ， 因 为 在 一 次 DecreaseKey 操作 中 可 能 出 现 多 次 这 种 切除 。 

图 11-19 显示 在 Decreasekey 操作 之 前 斐 波 那 契 堆 中 的 一 棵 树 。 当 关键 字 为 39 的 节 
点 变 成 12 的 时 候 ， 堆 序 被 破坏 。 因 此 ， 该 节点 从 它 的 父 节点 中 切除 ， 变 成 了 一 棵 新 树 的 
根 。 由 于 包含 33 的 节点 被 标记 ， 这 是 它 第 二 个 失去 的 子 节点 ， 从 而 也 从 它 的 父 节点 (10) 中 
切除 。 现 在 ，10 也 失去 了 它 的 第 二 个 儿子 ， 于 是 它 又 从 5 中 切除 。 这 个 过 程 到 这 里 结束 ， 
因为 5 是 未 做 标记 的 。 现 在 把 节点 5 做 上 标记 ， 如 图 11-20 Bros. 
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图 11-19 将 39 减 成 12 之 前 斐 波 那 契 堆 中 的 一 棵 树 
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图 11-20 在 DecreasekKey i&ÍtF 2 Im 3EiE AR H rn h Hr E 


注意 ， 过 去 做 过 标记 的 节点 10 和 33 不 再 被 标记 ， 因 为 现在 它们 都 是 根 节 点 。 这 在 时 
间 界 的 证 明 中 是 极其 重要 的 。 


11.4.4 时 间 界 的 证 明 
注意 ， 标 记 节 点 的 原因 是 我 们 需要 给 任意 节点 的 秩 R( 子 节点 的 个 数 ) 确 定 一 个 界 。 现 


在 我 们 证 明 具 有 N 个 后 裔 的 任意 节点 的 秩 为 O(log ND. 

引 理 11.1 令 和 是 斐 波 那 契 堆 中 的 任意 节点 。 令 ci 为 X 的 第 ;个 最 年 轻 的 儿子 。 则 c, 
的 秩 至 少 是 i 一 2。 

证 明 : 在 c; 被 链接 到 X 上 的 时 候 ，XX 已 经 有 (年 长 的 ) 儿 子 es cs os cas FR, 
当 链 接 到 c, 时 X 至 少 有 i 一 1 个 儿子 。 由 于 节点 只 有 当 它 们 有 相同 的 秩 的 时 候 才 链接 ， 由 此 
可 知 在 c, 被 链接 到 X 上 的 时 候 c; 至 少 也 有 i 一 1 个 儿子 。 从 这 个 时 候 起 ， 它 已 经 至 多 失去 
一 个 子 节点 ， 不 然 的 话 就 已 经 从 X 中 切除 。 因 此 ，c; 至 少 有 i 一 2 个 儿子 。 

从 引 理 11. 1 容易 证 明 ， 秩 为 R 的 任意 节点 必然 有 许多 的 后 背 。 

8]3:811.2 AR X48 F,—1, F,—1, ARF, =F it F-22208 1.2 7) ERM 
ZH, KARS\HESPREAYA Fe th BR LHEAT). 

WEBB: 4 S, 是 秩 为 R 最 小 的 树 。 显 然 ，S, = 二 1 和 S, 王 2。 根 据 引 理 11.1. RAR 的 一 
棵 树 含 有 秩 至 少 为 R 一 2，R 一 3，…，1, 0 的 子 树 ， 再 加 上 另 一 棵 至 少 有 一 个 节点 的 子 树 。 


连同 Sp 的 根本 身 一 起 ， 这 就 给 出 Se = 2 MIS, 的 Se- 的 一 个 最 小 值 。 容 易 证 明 ， 
Sr — Fg. (H2] 1. 9a) 。 

AA x Fir Ji] AR 3E CIE SURE VL FK ROAK. MA AIRA s SJ i AY FE XS ex LB X 
最 多 为 O(log 2. FÆ, RNA: 

5318 11.3 斐 波 那 契 堆 中 任意 节点 的 秩 为 O(log ND. 

证 明 : 直接 从 上 面 的 讨论 得 出 。 

假如 我 们 所 关心 的 只 是 Merge. Insert 以 及 DeleteMin 等 操作 的 时 间 界 ,那么 现在 
就 可 以 停止 并 证 明 所 要 的 摊 还 时 间 界 了 。 当 然 ， 斐 波 那 契 堆 的 全 部 意义 在 于 还 要 得 到 一 个 
对 于 DecreaseKkey AY OCD HT R. 

对 于 一 次 DecreaseKey 操作 所 需要 的 实际 时 间 是 1 加 上 在 该 操作 期 间 所 执行 的 级 联 
切除 的 次 数 。 由 于 级 联 切 除 的 次 数 可 能 会 比 O(1) 多 很 多 ， 为 此 我 们 需要 用 位 势 的 损失 来 作 
为 补偿 。 从 图 11-20 中 看 到 ， 树 的 棵 数 实际 上 是 随 着 每 次 级 联 切除 而 增加 的 ， 因 此 我 们 必 
须 增强 位 势 函 数 ， 使 它 包含 某 种 在 级 联 切 除 期 间 能 够 递减 的 成 分 。 注 意 ， 我 们 不 能 从 位 势 
函数 中 抛 开 树 的 棵 数 ， 因 为 这 样 就 不 能 证 明 Merge 操作 的 时 间 界 了 。 表 次 观察 图 11-20. 
发 现 级 联 切 除 引 起 被 标记 的 节点 的 个 数 的 减少 ， 因 为 每 个 被 级 联 切除 分 出 的 节点 都 变 成 了 
未 标记 的 根 。 由 于 级 联 切 除 花 费 1 个 单元 的 实际 时 间 并 将 树 的 位 势 增加 1， 因 此 我 们 将 每 个 
标记 的 节点 算 作 2 个 位 势 单位 。 利 用 这 种 方法 ,我 们 就 获得 一 种 消除 级 联 切 除 次 数 的 机 会 。 

定理 11.4 Æ AZ} F Insert. Merge 和 DecreaseKey 的 挫 还 时 间 界 均 为 
O(1)， 而 对 于 DeleteMin 则 是 O(log N). 

WEBB: 位 势 是 斐 波 那 契 堆 的 集合 中 树 的 棵 数 加 上 两 倍 的 标记 节点 数 。 像 通常 一 样 ， 初 
始 的 位 势 为 0 并 且 总 是 非 负 的 。 于 是 ， 经 过 一 系列 操作 之 后 ， 总 的 摊 还 时 间 则 是 总 的 实际 
时 间 的 一 个 上 界 。 

对 于 Merge 操作 ， 实 际 时 间 为 常数 ， 而 树 和 标记 节点 的 数目 是 不 变 的 ， 因 此 根据 
式 (11. 2)， 摊 还 时 间 为 OA). 
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对 于 Insert 操作 ， 实 际 时 间 是 常数 ， 树 的 棵 数 增加 1， 而 标记 节点 的 个 数 不 变 。 因 
此 ， 位 势 最 多 增加 1， 所 以 摊 还 时 间 也 是 OCIO, 

对 于 DeleteMin RWE, $ R 为 包含 最 小 元 素 的 树 的 秩 ， 并 令 工 是 操作 前 树 的 棵 数 。 
为 执行 一 次 DeleteMin， 我 们 再 一 次 将 树 的 儿子 分 离 ， 得 到 另外 RR 棵 新 的 树 。 注 意 ， 虽 然 
这 (通过 使 它们 成 为 未 标记 的 根 ) 可 以 除去 一 些 标记 的 节点 ， 但 却 不 能 创建 另外 的 标记 节点 。 
这 尺 棵 新 树 ( 和 其 余 工 棵 树 一 起 ) 现 在 必须 合并 ， 根 据 引 理 11. 3 其 花费 为 T 十 R 二 log N= 
T 十 O(log N) 。 由 于 最 多 可 能 有 O(log N) 棵 树 ， 而 标记 节点 的 个 数 又 不 可 能 增加 ， 因 此 位 
势 的 变化 最 多 是 O(log NO 一 工 。 将 实际 时 间 和 位 势 的 变化 加 起 来 则 得 到 DeleceMin 的 
O(log N) 摊 还 时 间 界 。 

最 后 考虑 DecreaseKey 操作 。 令 C 为 级 联 切 除 的 次 数 。DectreaseKey 的 实际 花费 为 
C 十 1， 它 是 所 执行 的 切除 的 总 数 。 第 一 次 ( 非 级 联 ) 切 除 创 建 一 棵 新 树 从 而 使 位 势 增 1。 每 
次 级 联 切除 都 建立 一 棵 新 树 ， 但 却 把 一 个 标记 节点 转变 成 未 标记 的 ( 根 ) 节 点 ， 合 计 每 次 级 
联 切除 有 一 个 单位 的 净 损 失 。 最 后 一 次 切除 也 可 能 把 一 个 未 标记 节点 (在 图 11-20 中 这 个 节点 
为 5) 转 变 成 标记 节点 ， 这 就 使 得 位 势 增加 2。 因 此 ， 位 势 总 的 变化 最 多 是 3 一 C。 把 实际 时 
间 和 位 势 变化 加 起 来 则 得 到 总 和 为 4， 即 OCD, 


11.5 伸展 树 


作为 最 后 一 个 例子 ， 我 们 来 分 析 伸展 树 的 运行 时 间 。 由 第 4 章 得 知 ， 在 对 某 项 X 进行 
访问 之 后 ， 一 步 展 开通 过 下 述 三 种 一 系列 的 树 操作 将 X 移 至 根 处 : 单 旋转 (zig)、 之 字形 
(zig-zag) 旋 转 和 一 字形 (zig-zig) 旋 转 。 树 的 这 些 旋转 如 图 11-21 所 示 。 我 们 约定 : 如 果 在 节 
点 执行 一 次 树 的 旋转 ， 那 么 旋转 前 P 是 它 的 父 节点 ，G 是 它 的 祖父 节点 ( 若 X 不 是 根 的 
儿子 的 话 )。 
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图 11-231 单 旋转 、 之 字形 和 一 字形 旋转 操作 ， 每 个 都 有 一 个 对 称 的 情形 (未 示 出 ) 


我 们 知道 ， 对 节点 X 任意 的 树 操作 所 需 的 时 间 正 比 于 从 根 到 X 的 路 径 上 的 节点 的 个 
数 。 如 果 我 们 把 每 个 单 旋转 操作 计 为 一 次 旋转 ， 把 每 个 之 字形 操作 或 一 字形 操作 计 为 两 次 
旋转 ， 那 么 任何 访问 的 花费 等 于 1 加 上 旋转 的 次 数 。 

为 了 证 明 展 开 操作 的 O(log NN) 挫 还 时 间 界 ， 我 们 需要 一 个 位 势 函 数 ， 该 函数 对 整个 展 
开 操 作 最 多 能 够 增加 O(log N) 而 且 在 操作 期 间 也 消除 所 执行 的 旋转 的 次 数 。 找 出 满足 这 些 
原则 的 位 势 函数 根本 不 是 一 件 容 易 的 事情 。 首 先 容易 猜 到 的 位 势 函数 或 许 就 是 树 上 所 有 节 
点 的 深度 的 和 。 这 个 猜测 行 不 通 ， 因 为 位 势 在 一 次 访问 期 间 可 能 增加 @CN) 。 当 一 些 元 素 以 
连贯 顺序 插入 时 会 有 这 样 的 典型 例子 发 生 。 

一 个 确实 有 效 的 位 势 函 数 D E SUN 

®(T) = >} log SO 


其 中 SQ 代表 i MARY PRC AD. MB RACE T 所 有 节点 i 所 取 的 SCORS 
对 数 和 。 
为 简化 记号 ， 我 们 定义 : 
R(i) = log SC) 


®(T) = JRG 


ie T 

ROGO XS A LER. XX TURIS 2E FRAT EA ABC 8E TIAE Pr. SL BAB) A SE DOE S8 HE 
中 所 使 用 的 术语 。 在 所 有 这 些 数 据 结 构 中 ， 秩 的 意义 多 少 有 些 不 同 ， 不 过 ， 秩 一 般 是 指 树 
的 大 小 的 对 数 的 阶 (幅度 ，magnitude) 。 对 于 具有 N 个 节点 的 一 棵 树 工 ， 根 的 秩 就 是 RCT) = 
log N。 用 秩 的 和 作为 位 势 函 数 类 似 于 使 用 高 度 的 和 作为 位 势 函 数 。 重 要 的 差别 在 于 ， 当 一 
次 旋转 可 以 改变 树 中 许多 节点 的 高 度 时 ， 却 只 有 XX、P 和 G 的 秩 发 生变 化 。 

在 证 明 主 要 的 定理 之 前 ， 我 们 需要 下 列 的 引 理 。 

引 理 11.4 de 十 b 委 c， 且 4 和 0 均 为 正 整 数 ， 那 么 

log a + log b < 2 logc—2 
证 明 : 根据 算术 -几何 平均 不 等 式 ， 
Vab <(a+b)/2 


于 是 

Jab <c/2 
两 边 平 方 得 到 

ab <c’/4 
两 边 再 取 对 数 则 定理 得 证 。 


我 们 现在 就 来 证 明 主要 定理 ,证 明 过 程 中 要 注意 所 用 到 的 一 些 预备 知识 。 

定理 11.5 在 节点 和 展开 一 棵 根 为 工 的 树 的 摊 还 时 间 最 多 为 S3ORCT) - RCX)) -1— 
O(log N). 

WEBB: (AMAR 工 中 节点 的 秩 的 和 。 

如 果 X 是 工 的 根 ， 那 么 不 存在 旋转 ， 因 此 位 势 没 有 变化 。 访 问 该 节点 的 时 间 是 1; 于 


T 349 


350 


447) 


数据 结构 与 算法 分 析 C 语言 描述 


是 ， 摊 还 时 间 为 1， 定理 成 立 。 因 此 ， 我 们 可 以 假设 至 少 有 一 次 旋转 。 

对 于 任意 一 步 展开 操作 ， 令 ROXO S, OO d fe xb Me feng X 的 秩 和 大 小 ， 并 令 
Rr(CX) 和 SrCX) 是 在 这 步 展 开 操作 后 X 的 秩 和 大 小 。 我 们 将 证 明 对 一 次 单 旋转 所 需要 的 摊 
还 时 间 最 多 为 3(R/,(X) 一 R;(X)) 十 1， 而 对 一 次 之 字形 旋转 或 一 字形 旋转 的 挫 还 时 间 最 多 
为 3(Rj,(X) 一 R;(X))。 我 们 将 证 明 ， 当 我 们 对 所 有 各 步 展 开 求 和 时 ， 所 得 到 的 和 就 是 想 要 
的 时 间 界 。 

一 步 单 旋转 : 对 于 单 旋 转 ， 实 际 时 间 为 1， 而 位 势 变化 为 R(X) 十 Rj(P) 一 Ri;(X) 一 
R;(P)。 注 意 ， 位 势 变化 容易 计算 ， 因为 只 有 X 的 和 PP 的 树 大 小 有 变化 。 于 是 ， 

AT4 = 1+ ROO +R,(P) — R.OX) — R,(P) 
从 图 11-21 中 看 到 S;(P) 宇 S,(P)， 因 此 得 到 R;,(P) 宇 Rj(P)。 这 样 ， 
AT <1+R,(X) — R(X) 
由 于 S,COZS;OO,. FHR-XO-RCXY)SO, ATT WMA. 448 
AT, <1+3(R/(X) —R,(X)) 
一 步 之 字形 旋转 : 对 于 这 种 情况 ,实际 的 花费 是 2， 而 位 势 变化 为 R(X) 十 Rj(P) 十 
Rj;(G) 一 R;(X) 一 R;(P) 一 R;(G)。 这 就 给 出 一 个 推 还 时 间 界 
AT vig ag = 2+R,(X)+R,(P) + RjG) — R(X) — R; (P) — RO 
从 图 11-21 中 看 到 ，S,(X) 二 S$;(G)， 于 是 它们 的 秩 必 然 相 等 。 因 此 我 们 得 到 
AT = 2+R,(P) +R,/(G) — R(X) — R;(P) 
我 们 还 看 到 S;(P) 宇 S;(X)。 因 而 R;(X) 二 R;(P)。 代 入 右边 得 到 
AT igus X 2+R,/(P) + RG) — 2R;(X) 
从 图 11-21 中 看 到 S,(P)+S,(@<S,(X), WM gs 8 11. 4， 那 么 得 到 
log S;(P) + log S;(G) xc 2 log S;(X) — 2 
由 秩 的 定义 可 知 ， 它 变 成 
R,(P)+R,(G) x 2R,CX) — 2 
我 们 将 其 代入 则 得 
AT < R4 —2R; CX) 
« 2(R,CX) — R,(X)) 
由 于 R(X) 宇 R;(X)， 因 此 我 们 得 到 
A Teese € 3CR,0O0 — RCX)) 

一 步 一 字形 旋转 : 第 三 种 情况 是 一 字形 旋转 。 这 种 情形 的 证 明 非 常 类 似 于 之 字形 的 情 
形 。 重 要 的 不 等 式 是 R; (X)=R; (G), R(X)ER; (P), Ri (X)<R (P), 以 及 S; OO-S, 
(G) 达 Sj(X)。 我 们 把 具体 细节 留 作 练 习 11. 8。 

整个 展开 的 摊 还 花费 是 各 步 展 开 的 摊 还 花费 的 和 。 图 11-22 显示 在 节点 2 的 一 次 展开 中 
所 执行 的 各 步 展 开 的 过 程 。 令 RSD, R2), RDA R (2) 是 这 4 棵 树 每 棵 在 节点 2 的 
秩 。 第 一 步 是 之 字形 旋转 ， 其 花费 最 多 为 3(R: (2) 一 R, (2))。 第 二 步 是 一 字形 旋转 ， 其 花 
费 为 3(R;(2) 一 R,(2))。 最 后 一 步 是 单 旋转 ， 花 费 不 超过 3(R,(2) 一 R (2)) 十 1。 因 此 总 的 
花费 是 3CR,(2) 一 Ri1(2)) 十 1。 





图 11-22 ”在 节点 2 展开 中 涉及 的 展开 各 步 


一 般 地 ， 通 过 把 所 有 旋转 (其 中 最 多 有 一 个 旋转 可 能 是 一 次 单 旋转 ) 的 摊 还 时 间 加 起 来 ， 
我 们 看 到 ， 在 节点 X 展开 的 总 的 时 间 最 多 为 3CR,CXO —R, X0 F1, XP R;(X) 是 XX 在 第 
一 步 展 开 前 的 秩 ， 而 Rr(X) 是 X 在 最 后 一 步 展开 后 的 秩 。 由 于 最 后 一 次 展开 把 X 留 在 根 
处 ， 因 此 我 们 得 到 3CRj(T) 一 R;(X)) 十 1 的 摊 还 界 ， 这 个 界 为 O(log ND. 

因为 对 一 棵 伸展 树 的 每 一 次 操作 都 需要 一 次 展开 ， 因 此 任意 操作 的 摊 还 时 间 是 在 一 次 
展开 的 摊 还 时 间 的 一 个 常数 倍数 之 内 。 因 此 ， 所 有 伸展 树 操 作 花 费 O(log N) 挫 还 时 间 。 通 
过 使 用 更 一 般 的 位 势 函数 ， 能 够 证 明 伸 展 树 具 有 若干 显著 的 性 质 。 更 多 的 细节 在 练习 中 


讨论 。 


Q 总结 


我 们 在 这 一 章 看 到 摊 还 分 析 是 如 何 用 于 在 一 些 操作 间 分 配 负荷 。 为 了 进行 分 析 ， 我 们 
构造 一 个 虚构 的 位 势 函数 ， 这 个 位 势 函 数 度量 系统 的 状态 。 高 位 势 的 数据 结构 是 易 变 的 ， 
它 建 立 在 相对 低廉 的 操作 之 上 。 当 昂贵 的 花费 来 自 一 次 操作 的 时 候 ， 它 会 由 前 面 一 些 操作 
节省 下 的 积蓄 来 支付 。 可 以 把 位 势 看 成 对 付 灾难 的 潜能 ， 因 为 非常 昂贵 的 操作 只 有 在 数据 
结构 具有 一 个 高 位 势 以 及 已 经 使 用 的 时 间 比 规定 的 时 间 少 很 多 时 才 可 能 发 生 。 

数据 结构 中 的 低位 势 意味 着 每 次 操作 的 花费 大 致 等 于 指定 给 它 的 消耗 量 。 负 位 势 意味 
着 欠 债 ; 花费 的 时 间 多 于 规定 的 时 间 ， 因 此 分 配 (或 推 还 ) 的 时 间 不 是 一 个 有 意义 的 界 。 

正如 式 (11. 2) 所 表达 的 ， 一 次 操作 的 摊 还 时 间 等 于 实际 时 间 和 位 势 变化 的 和 。 整 个 操 
作 序 列 的 摊 还 时 间 等 于 总 的 序列 操作 时 间 加 上 位 势 的 净 变 化 。 只 要 这 个 净 变 化 是 正 的 ， 那 
么 摊 还 界 就 提供 实际 时 间 花 费 的 一 个 上 界 并 且 是 有 意义 的 。 

选择 位 势 函数 的 关键 在 于 保证 最 小 的 位 势 要 产生 在 算法 的 开始 ， 并 使 得 位 势 对 低廉 的 
操作 增加 而 对 高 昂 的 操作 减少 。 重 要 的 是 过 剩 或 节省 的 时 间 要 由 位 势 中 相反 的 变化 来 度量 。 
不 幸 的 是 ， 有 时 候 这 说 着 容易 做 起 来 难 。 


9 练习 
11. 1 什么 时 候 向 一 个 二 项 队列 进行 连续 M 次 插入 的 花费 少 于 2M 个 时 间 单 位 的 时 间 ? 
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设 建立 一 个 有 N= 二 2* 一 1 个 元 素 的 二 项 队列 ， 交 替 进 行 M 对 Insert 和 DeleteMin ## 
VE. TA, 每 次 操作 花费 O(log N) 时 间 。 为 什么 这 与 插入 的 O(1) 摊 还 时 间 界 不 矛盾 ? 
通过 给 出 一 系列 导致 一 次 合并 需要 B(N) 时 间 的 操作 ， 证 明 对 于 课文 中 描述 的 斜 堆 操 
VERI O(log N) 摊 还 界 不 能 转换 成 最 坏 情形 界 。 
指出 如 何 进行 一 趟 自 顶 向 下 地 合并 两 个 斜 堆 并 将 合并 的 花费 减 到 O(1) 摊 还 时 间 。 
扩展 斜 堆 以 支持 具有 O(log NN) 摊 还 时 间 的 DecreaseKey 操作 。 
实现 斐 波 那 契 堆 并 比较 其 与 二 叉 堆 在 用 于 Dijkstra 算法 时 的 性 能 。 
斐 波 那 契 堆 的 标准 实现 方法 需要 每 个 节点 四 个 指针 (父亲 、 儿 子 以 及 两 个 兄弟 ) 。 指 
出 如 何 减 少 指针 的 数量 而 运行 时 间 花 费 最 多 是 一 个 常数 因子 。 
证 明 一 次 一 字形 展开 的 挫 还 时 间 多 为 3(R CX) - R/CX)) e 
通过 改变 位 势 函 数 能 够 证 明 展 开 的 不 同 的 界 。 令 权 函 数 (weight function)W(i) 为 指定 给 
树 中 每 个 节点 的 某 个 函数 ， 令 S(i) 为 以 i 为 根 的 子 树 上 所 有 节点 (包括 节点 i 本身) 的 权 
的 和 。 对 于 与 用 在 展开 界 的 证 明 中 的 该 函数 相对 应 的 所 有 的 节点 ， 特 殊 情 况 为 
W(i)—1.4 N 为 树 中 节点 的 个 数 ， 并 令 M 为 访问 的 次 数 。 证 明 下 列 两 个 定理 : 
a. 总 的 访问 时 间 是 O(M 十 (M 十 N)log N). 

xb. 如果 q 为 项 i 被 访问 的 次 数 ， 而 对 所 有 的 7, g>0, BARA TTT A] A 











O(M+ Ya log(M /gi )) 


a. 指出 如 何 实现 对 伸展 树 的 Merge 操作 使 得 从 NN 个 单元 素 树 开始 的 任意 N-1 次 

Merge 操作 序列 花费 O(N log’ NN) 时 间 。 
xb. 将 这 个 界 改 进 为 O(N log N)。 

我 们 在 第 5 章 描述 了 再 散 列 (rehashing): 当 一 个 表 的 表 元 素 超过 容量 一 半 的 时 候 ， 

则 构造 一 个 两 倍 大 的 新 表 ， 且 整个 老 表 要 重新 被 散 列 。 使 用 位 势 函 数 给 出 一 个 正式 

的 摊 还 分 析 来 证 明 一 次 揪 和 人 操作 的 摊 还 时 间 为 O(1)。 

证 明 ， 如 果 不 允 许 删 除 ， 那 么 到 一 棵 N- 节 点 2-3 树 的 任意 顺序 的 M 次 插入 操作 产 

# O(M+N) RRR. 

具有 堆 序 的 双 端 队列 (deque) 是 由 一 些 项 的 表 组 成 的 数据 结构 ， 可 以 对 其 进行 下 列 

操作 : 

Push(X, D): 将 项 XX 插入 到 双 端 队列 D 的 前 端 。 

Pop(D): 从 双 端 队列 D 中 除去 前 端 项 并 将 它 返 回 。 

Inject(X, D): 把 项 X 插入 到 双 端 队列 D 的 尾 端 。 

Eject(D): 从 双 端 队列 D 中 除去 尾 端 项 并 将 它 返 回 。 

FindMin(D): 返回 双 端 队列 DD 的 最 小 项 。 

a. 描述 如 何以 每 个 操作 常数 挫 还 时 间 支 持 这 些 操作 。 

xb. 描述 如 何以 每 个 操作 常数 最 坏 情 形 时 间 支 持 这 些 操作 。 
证 明 二 项 队列 实际 上 以 O(1) 摊 还 时 间 支 持 合并 操作 。 定 义 二 项 队列 的 位 势 为 树 的 
棵 数 加 上 最 大 的 树 的 秩 。 
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Q 参考 文献 


论文 [10] 提 供 了 对 挫 还 分 析 的 极 好 的 综述 

下 面 的 参考 文献 中 有 许多 和 前 几 章 中 的 相同 ， 我 们 再 次 引用 它们 是 为 了 方便 和 完善 。 
二 项 队列 首先 在 文献 [11] 中 阐述 并 在 文献 [1] 中 分 析 。 练 习 11.3 和 11.4 ee 
[9]。 斐 波 那 契 堆 在 文献 [3] 中 论述 。 练 习 11. 9a 指出 ， 在 最 佳 静态 查找 树 的 一 个 常数 因子 
之 内 伸展 树 是 最 优 的 。 练 习 11. 9b 则 指出 ， RE hp 
是 最 优 的 。 这 些 以 及 另外 两 个 强 结果 在 原始 的 伸展 树 论 文 [7] 中 得 以 证 明 。 

伸展 树 的 合并 操作 在 文献 [6] 中 描述 。 练 习 11. 12 在 文献 [2] 中 解决 ， 其 中 隐 含 用 到 捧 
还 概念 。 该 论文 还 指出 如 何 更 有 效 地 合并 2-3 树 。 练 习 11. 13 的 一 种 解法 可 在 文献 [4] 中 找 
到 。 练 习 11. 14 取 自 文献 [5] 。 

在 文献 [8] 中 使 用 摊 还 分 析 设 计 一 种 联机 算法 ， 该 算法 处 理 一 系列 查询 ， 其 所 花费 的 时 
间 比 同类 问题 的 脱 机 算法 只 多 一 个 常数 因子 。 
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我 们 在 这 一 章 讨论 七 种 侧重 于 实用 的 数据 结构 。 首 先 考察 第 4 章 讨 论 过 的 AVL 树 的 变 
种 ， 包 括 优化 的 伸展 树 、 红 黑 树 、( 在 前 面 第 10 章 讨 论 过 的 ) 跳 跃 表 的 确定 性 的 形式 、AA 
树 以 及 treap 树 。 

然后 我 们 考察 一 种 可 以 用 于 多 维 数据 的 数据 结构 。 在 这 种 情况 下 ， 每 一 项 均 可 有 若干 
关键 字 。k-d 树 对 任何 关键 字 都 能 进行 相关 的 查找 。 

最 后 ， 我 们 考察 配对 堆 (pairing heap)， 虽 然 缺 乏 分 析 结 果 ， 但 是 它 似乎 是 斐 波 那 契 堆 
最 实用 的 变种 。 

复议 的 论题 包括 : 

e 在 适当 的 时 候 非 递归 的 自 顶 向 下 (而 不 是 从 底 向 上 ) 的 查找 树 的 各 种 实现 方法 。 

o 详细 、 优 化 的 尤其 是 利用 标记 节点 的 实现 方法 。 


12.1 自 顶 向 下 伸展 树 


在 第 4 3. 我 们 讨论 了 基本 的 伸展 树 操作 。 当 一 项 XX 作为 一 片 树叶 插入 时 ， 称 为 展开 
Csplay) 的 一 系列 树 的 旋转 使 得 X 成 为 树 的 新 的 根 。 展 开 操 作 也 在 查找 期 间 执 行 ， 而 且 如 果 
一 项 也 没有 找到 ， 那 么 就 要 对 访问 路 径 上 的 最 后 的 节点 施行 一 次 展开 。 在 第 11 3€. 我 们 指 
出 一 次 展开 树 操 作 的 挫 还 时 间 为 O(log ND. 

这 种 展开 操作 的 直接 实现 需要 从 根 沿 树 往 下 的 一 次 遍历 ， 以 及 而 后 的 从 底 向 上 的 一 次 
遍历 。 这 或 者 可 以 通过 保存 一 些 父 指针 来 完成 ， 或 者 通过 将 访问 路 径 存 储 到 一 个 栈 中 来 完 
成 。 但 遗憾 的 是 ， 这 两 种 方法 均 需 大 量 的 开销 ， 而 且 二 者 都 必须 处 理 许多 特殊 的 情况 。 在 
这 一 节 ， 我 们 指出 如 何在 初始 访问 路 径 上 施行 一 些 旋转 。 结 果 得 到 在 实践 中 更 快 的 过 程 ， 
只 用 到 0(1) 的 额外 空间 ， 但 却 保持 了 O(log NN) 的 挫 还 时 间 界 。 

图 12-1 指出 单 旋转 、 一 字形 和 之 字形 旋转 。( 照 惯例 ， 忽 略 三 种 对 称 的 旋转 ,) 在 访问 的 
任意 时 刻 ， 我 们 都 有 一 个 当前 节点 X， 它 是 其 子 树 的 根 ; 在 图 中 将 它 表 示 成 “中 间 ” 树 ?。 树 
L 把 节点 都 存放 在 小 于 X HT 中 ， 但 不 在 X 的 子 树 中 ; 类 似 地 ， 树 R 把 节点 存在 大 于 XX 
的 子 树 中 ， 但 不 在 X 的 子 树 中 。 初 始 时 X 为 工 的 根 ,， 而 志和 有 R 是 空 树 。 

如 果 旋 转 是 一 次 单 旋 转 ， 那 么 根 在 Y 的 树 变 成 中 间 树 的 新 根 。X 和 子 树 B 连接 而 成 为 
R 中 最 小 项 的 左 儿子 ; X 的 左 儿 子 逻 辑 上 成 为 NULLS 。 结 果 ，X 成 为 R 的 新 的 最 小 项 。 特 
别 要 注意 ， 为 使 单 旋转 情形 适用 ，Y 不 一 定 必 须 是 一 片 树 叶 。 如 果 我 们 查找 小 于 Y 的 一 项 ， 
而 Y 没有 左 儿子 (但 确 有 一 个 右 儿子 )， 那 么 这 种 单 旋转 情形 将 是 适用 的 。 

对 于 一 字形 旋转 ,我 们 有 类 似 的 剖析 。 关 和 键 是 在 X 和 Y 之 间 施 行 一 次 旋转 。 之 字形 旋 
转 把 底部 节点 Z 带 到 中 间 树 的 顶部 ， 并 把 子 树 X 和 YY 分别 附 接 到 R AIL b. EXC. Y 被 附 
接 从 而 成 为 L 中 的 最 大 项 。 

之 字形 旋转 这 一 步 多 少 可 以 得 到 简化 ， 因 为 没有 旋转 要 执行 ，Z 不 再 是 中 间 树 的 根 ，Y 


O “为 简单 起 见 ， 我 们 不 区 分 一 个 “节点 ”和 该 节点 中 的 项 。 
O ”在 程序 中 尺 的 最 小 节点 没有 NULL 左 指针 ， 因 为 没有 必要 。 这 意味 着 ，PrintTree(R) 将 包含 某 些 项 ， 这些 
项 逻辑 上 不 在 尺 中 。 
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图 12-1 自 顶 向 下 展开 旋转 : 单 旋转 、 一 字形 旋转 及 之 字形 旋转 
取而代之 ， 如 图 12-2 所 示 。 因 为 之 字形 旋转 的 动作 变 成 与 单 旋转 情形 相同 ， 所 以 编程 得 到 
简化 。 看 起 来 这 是 有 利 的 ， 因 为 对 大 量 情 形 的 测试 是 要 费时 的 。 其 缺点 是 ， 仅 仅 为 了 降低 
一 层 ， 我 们 在 展开 过 程 中 却 要 进行 更 多 的 迭代 。 
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图 12-2 简化 的 自 顶 向 下 的 之 字形 旋转 

图 12-3 指出 一 旦 执行 完 最 后 一 步 展 开 我 们 将 如 何 处 理 L、R 和 中 间 树 以 形成 一 棵 树 。 
特别 要 注意 ， 这 里 的 结果 不 同 于 从 底部 向 上 的 展开 。 关 键 的 问题 在 于 这 里 保持 了 O(log N) 
Bg OK] 12.1). 
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图 12-3 自 顶 向 下 展开 的 最 后 整理 


顶部 向 下 展开 算法 的 一 个 例子 如 图 12-4 所 示 。 我 们 想 要 访问 树 中 的 19。 第 一 步 是 一 个 
之 字形 旋转 。 根 据 图 12-2( 的 对 称 形式 )， 我 们 把 根 在 25 的 子 树 带 到 中 间 树 的 根 处 ， 并 把 12 
和 它 的 左 子 树 接 到 二 上。 

下 一 步 是 一 个 一 字形 旋转 ，15 被 提高 到 中 间 树 的 根 处 ， 并 在 20 和 25 之 间 进 行 一 次 施 
转 ， 所 得 到 的 子 树 被 连接 到 R 上 。 此 时 查找 19 导致 终止 单 旋转 。 中 间 树 的 新 根 为 18， 而 
15 和 它 的 左 子 树 作为 工 的 最 大 节点 的 右 儿子 被 接 上 。 根 据 图 12-3 重新 组 装 并 结束 该 步 
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图 12-4 (访问 上 面 树 中 的 19) 自 项 向 下 展开 的 各 步 


我 们 使 用 带 有 左 指针 和 右 指针 的 一 个 头 节点 最 终 包含 左 树 的 根 和 右 树 的 根 。 eee 
棵 树 初始 为 空 ， 因 此 使 用 一 个 头 分 别 对 应 初始 状态 右 树 或 左 树 的 最 小 或 最 大 节点 。 这 种 方 
EOUEUERMERSPI S s 树 。 第 一 次 左 树 变 成 非 空 时 ， 右 指针 将 被 初始 化 并 在 以 后 保持 

不 变 。 这 样 ， 在 自 项 向 下 查找 的 最 后 ， 它 将 包含 右 树 的 根 。 类 似 地 ， 左 指针 最 终 将 包含 左 
树 的 根 。 

图 12-5 所 示 的 过 程 Initialize 用 来 分 配 NullNode 标记 。 我 们 使 用 标记 NullNode 
表示 一 个 NULL 指针 。 我 们 将 反复 使 用 这 种 技术 来 简化 程序 (因而 使 得 程序 多 少 要 快 一 些 )。 
图 12-6 给 出 展开 过 程 的 程序 。 这 里 的 Header 节点 使 我 们 肯定 能 够 把 X SIR 的 最 大 节点 
上 而 不 必 担 心 尺 可 能 是 空 的 (对 于 处 理工 的 对 称 的 情形 类 似 地 进行 ) 。 





#ifndef _Splay_H 


struct SplayNode; 
typedef struct SplayNode *SplayTree; 


SplayTree MakeEmpty( SplayTree T ); 

SplayTree Find( ElementType X, SplayTree T ); 

SplayTree FindMin( SplayTree T ); 

SplayTree FindMax( SplayTree T ); 

SplayTree Initialize( void ); 

SplayTree Insert( ElementType X, SplayTree T ); 

SplayTree Remove( ElementType X, SplayTree T ); 
ElementType Retrieve( SplayTree T ); /* Gets root item */ 


#endif /* _Splay_H */ 


/* Place in the implementation file */ 
struct SplayNode 
{ 
ElementType Element; 
SplayTree Left; 
SplayTree Right; 
h 


typedef struct SplayNode *Position; 
static Position NullNode - NULL; /* Needs initialization */ 


SplayTree 
Initialize( void ) 
{ 
ifC NullNode == NULL ) 


NullNode = malloc( sizeof( struct SplayNode ) ); 
ifC NullNode == NULL ) 
FatalError( "Out of space!!!" ); 
NullNode-»Left = NullNode-»Right = NullNode; 
} 
return NullNode; 


图 12-5 伸展 树 : 声明 和 初始 化 





/* Top-down splay procedure, */ 
/* not requiring Item to be in the tree */ 


| 
| SplayTree 
| Splay( ElementType Item, Position X ) 


static struct SplayNode Header; 
Position LeftTreeMax, RightTreeMin; 


Header.Left - Header.Right 
LeftTreeMax - RightTreeMin 
NullNode-»Element = Item; 


NullNode; 
&Header; 


wow 


while( Item != X->Element ) 
{ 
if( Item < X->Element ) 
{ 
if( Item < X->Left->Element ) 
X = SingleRotateWithLeft( X ); 
if( X->Left == NullNode ) 
break; 
/* Link. right */ 
RightTreeMin-»Left - X; 
RightTreeMin - X; 
X = X-»Left; 


图 12-6 自 项 向 下 的 展开 过 程 
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else 


if( Item > X->Right->Element ) 
X = SingleRotateWithRight( X ); 
if( X->Right == NullNode ) 
break; 
/* Link Left */ 
LeftTreeMax->Right = X; 
LeftTreeMax = X; 
X = X->Right; 


} 
} /* while Item != X->Element */ 


/* Reassemble */ 
LeftTreeMax->Right = X->Left; 
RightTreeMin->Left = X->Right; 
X->Left = Header.Right; 
X->Right = Header.Left; 


return X; 














正如 我 们 上 面 提 到 的 ， 在 展开 末尾 重新 组 装 之 前 ，Header. Left fll Header. Right 
分 别 指 着 R 和 L( 这 不 是 一 个 排 印 错误 一 一 遵从 指针 的 指向 )。 除 了 这 个 细节 之 外 ， 该 程序 
是 相对 简单 的 。 

图 12-7 显示 将 一 项 插入 到 树 了 中 的 过 程 。 一 个 新 的 指针 (如 果 需 要 ) 被 分 配 ， 且 如 果 T 
是 空 的 ， 那 么 建立 一 棵 单 节点 树 。 否 则 ,我们 围绕 Item 展开 了 T。 若 工 的 新 根 的 数据 等 于 
Item， 则 我 们 有 一 个 复制 拷贝 ; 我 们 不 是 再 次 插入 Item， 而 是 为 将 来 的 插入 保留 New- 
Node 并 立即 返回 。 如 果 了 的 新 根 含有 大 于 Item 的 值 ， 那 么 工 的 新 根 和 它 的 右 子 树 变 成 
NewNode 的 一 棵 右 子 树 ， 而 THAT MM RA NewNode 的 左 子 树 。 如 果 工 的 新 根 含 有 小 
T Item 的 值 ， 那 么 类 似 的 逻辑 仍然 适用 。 在 这 两 种 情况 下 ，NewNode 均 成 为 新 的 根 。 





SplayTree 
Insert( ElementType Item, SplayTree T ) 
{ 

static Position NewNode = NULL; 


if( NewNode == NULL ) 
{ 
| NewNode - malloc( sizeof( struct SplayNode ) ); 
if( NewNode == NULL ) 
FatalError( "Out of space!!!" ); 


NewNode->Element = Item; 
if( T == NullNode ) 


NewNode->Left = NewNode->Right = NullNode; 
T = NewNode; 
} 
else 
{ 
T = Splay( Item, T ); 
if( Item < T->Element ) 
1 








图 12-7 自 顶 向 下 伸展 树 的 插入 


在 第 4 章 ， 我 们 证 明了 伸展 树 中 的 删除 是 容易 的 ， 因 为 一 次 展开 将 把 删除 目标 放 在 根 
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NewNode->Left = T->Left; 
NewNode->Right = T; 
T->Left = NullNode; 
T = NewNode; 

} 

else 

if( T->Element < Item ) 

{ 
NewNode->Right = T->Right; 
NewNode->Left = T; 
T->Right = NullNode; 
T = NewNode; 

} 

else 
return T; /* Already in the tree */ 


} 


NewNode = NULL; /* So next insert will call malloc */ 


return T; 








图 12-7 (#8) 


处 。 最 后 展示 图 12-8 中 的 删除 例 程 。 删 除 过 程 比 对 应 的 插入 过 程 还 要 短 ， 确 实 罕 见 。 


12. 


2 


历史 上 AVL 树 流 行 的 另 一 变种 是 红 黑 树 (red black tree), 。 对 红 黑 树 的 操作 在 最 坏 情 形 
下 花费 O(log N) 时 间 ， 而 且 我 们 将 看 到 ，( 对 于 插入 操作 的 ) 一 种 慎重 的 非 递归 实现 可 以 相 


红 黑 树 








SplayTree 
Remove( ElementType Item, SplayTree T ) 
{ 


Position NewTree 


ifC T != NullNode ) 
{ 
T = SplayC Item, T 2; 
if( Item == T->Element ) 
{ 
/* Found it! */ 
if( T->Left == NullNode ) 
NewTree = T->Right; 


else 

{ 
NewTree = T->Left 
NewTree = Splay( Item, NewTree ); 
NewTree->Right = T->Right; 

} 

free( T ); 


T = NewTree; 


} 


return T; 








图 12-8 自 项 向 下 的 删除 过 程 
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对 容易 地 完成 (与 AVL 树 相 比 ) 。 

红 黑 树 是 具有 下 列 着 色 性 质 的 二 又 查找 树 : 

l. 每 一 个 节点 或 者 着 红色 ， 或 者 着 黑色 。 

2. 根 是 黑色 的 。 

3. 如 果 一 个 节点 是 红色 的 ， 那 么 它 的 子 节点 必须 是 黑色 的 。 

4. 从 一 个 节点 到 一 个 NULL 指针 的 每 一 条 路 径 必 须 包 含 相 同 数 目的 黑色 节点 。 

着 色 法 则 的 一 个 推论 是 ， 红 黑 树 的 高 度 最 多 是 2 log(N 十 1)。 因 此 ， 查 找 保 证 是 一 种 对 
数 的 操作 。 图 12-9 显示 一 棵 红 黑 树 ， 其 中 的 红色 节点 用 双 圆 圈 表 示 。 

一 般 ， 困 难 在 于 将 一 个 新 项 插 和 人 到 树 中 。 通 常 把 新 项 作为 树叶 放 到 树 中 。 如 果 我 们 把 
该 项 涂 成 黑色 ， 那 么 我 们 肯定 违反 条 件 4， 因 为 将 会 建立 一 条 更 长 的 黑 节点 的 路 径 。 因 此 ， 
这 一 项 必须 涂 成 红色 。 如 果 它 的 父 节 点 是 黑 的 ， 插 和 人 完成 。 如 果 它 的 父 节 点 已 经 是 红色 的 ， 
那么 我 们 得 到 连续 红色 节点 ， 这 就 违反 了 条 件 3。 在 这 种 情况 下 ， 我 们 必须 调整 该 树 以 确保 
条 件 3 满足 ( 且 又 不 引起 条 件 4 被 破坏 )。 用 于 完成 这 项 任务 的 基本 操作 是 颜色 的 改变 和 树 
的 旋转 。 


12.2.1 自 底 向 上 插入 


我 们 已 经 提 到 ， 如 果 新 插入 的 项 的 父 节点 是 黑色 的 ， 那么 插入 完成 。 因 此 ， 将 25 插入 
到 图 12-9 的 树 中 是 简单 的 操作 。 


uA 
wa 
之 
a 
a 

^o 
Z 


@ G 
B] 12-9 红 黑 树 的 例子 (插入 序列 为 : 10, 85, 15, 70, 20, 60, 30, 50, 65, 80, 90, 40, 5, 55) 


如 果 父 节点 是 红色 的 ， 那 么 有 几 种 情形 (每 种 都 有 一 个 镜像 对 称 ) 需 要 考虑 。 首 先 ， 
假设 这 个 父 节点 的 兄弟 是 黑 的 (我 们 采纳 约定 : NULL 节点 都 是 黑色 的 ) 。 这 对 于 插入 3 
或 8 是 适用 的 ， 但 对 插入 99 不 适用 。 令 X 是 新 加 的 树叶 ， PP 是 它 的 父 节 点 ，S 是 该 父 
节点 的 兄弟 (车 存在 )，G 是 祖父 节点 。 在 这 种 情形 只 有 关 和 PP 是 红 的 ，G 是 黑 的 ， 否 
则 就 会 在 插入 前 有 两 个 相连 的 红色 节点 ,违反 了 红 黑 树 的 法 则 。 采 用 伸展 树 的 术语 ， 
X、 忆 和 G 可 以 形成 一 个 一 字形 链 或 之 字形 链 ( 两 个 方向 中 的 任意 一 个 方向 )。 图 12-10 
指出 当 书 是 一 个 左 儿子 时 (注意 有 一 个 对 称 情形 ) 我 们 如 何 旋转 该 树 。 即 使 X 是 一 片 树 
叶 ， 我 们 还 是 画 出 更 一 般 的 情形 ， 使 得 X 在 树 的 中 间 。 后 面 我 们 将 用 到 这 个 更 一 般 的 
旋转 。 

第 一 种 情形 对 应 PAG 之 间 的 单 旋 转 ， 而 第 二 种 情形 对 应 双 旋转 ， 该 双 旋 转 首先 在 X 
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和 PP 间 进 行 ， 然 后 在 X 和 G 之 间 进 行 。 当 编写 程序 的 时 候 ， 我 们 必须 记录 父 节点 、 祖 父 节 
点 ， 以 及 为 了 重新 连接 还 要 记录 曾祖 节点 。 





mi. Pa 
TY 3 3 f 
(Xy ZW A \ x YS) 
KAN ^B id EN S fas 
ZAN 和 一 一 Fem LEN 
O x 
CX s) og © 
P Pe pd A "v pe 
ras 3 fC X 人 人 入 AA. TAN 
/AN AA, LN AN ZEN ZEN. 18) 
umm d S i ZEN 
/BI / B2N 


图 12-10 如果 S 是 黑 的 ， 则 单 旋转 和 之 字形 旋转 有 效 


在 两 种 情形 下 ， 子 树 的 新 根 均 被 涂 成 黑色 ， 因 此 ， 即 使 原来 的 曾祖 是 红 的 ， 我 们 也 排 
除了 两 个 相 邻 红 节点 的 可 能 性 。 同 样 重要 的 是 ,这些 旋转 的 结果 是 通 向 A、B 和 C 诸 路 径 
上 的 黑 节 点 个 数 保持 不 变 。 

到 现在 为 止 一 切 顺 利 。 但是， 正如 我 们 企图 将 79 插入 到 图 12-9 树 中 的 情况 一 样 ， 如 果 
S 是 红色 的 ， 那 么 会 发 生 什么 情况 呢 ? 在 这 种 情况 下 ,初始 时 从 子 树 的 根 到 C 的 路 径 上 有 
一 个 黑色 节点 。 在 旋转 之 后 ， 一 定 仍然 还 是 只 有 一 个 黑色 节点 。 但 在 两 种 情况 下 ， 在 通 向 
C 的 路 径 上 都 有 三 个 节点 (新 的 根 、G 和 S)。 由 于 只 有 一 个 可 能 是 黑 的 ， 又 由 于 我 们 不 能 有 
连续 的 红色 节点 ， 于 是 我 们 必须 把 S 和 子 树 的 新 根 都 涂 成 红色 ， 而 把 G( 以 及 第 四 个 节点 ) 
涂 成 黑色 。 这 很 好 ， 可 是 ， 如 果 曾 祖 也 是 红色 的 那么 又 会 怎样 呢 ? 此 时 ， 我们 可 以 将 这 个 
过 程 朝 着 根 的 方向 上 滤 ， 就 像 对 B 树 和 二 又 堆 所 做 的 那样 ， 直 到 我 们 不 再 有 两 个 相连 的 红 
色 节 点 或 者 到 达 根 (将 它 重 新 涂 成 黑色 ) 处 为 止 。 


12.2.2 BME FAEH 


上 滤 的 实现 需要 用 一 个 栈 或 用 一 些 父 指针 保存 路 径 。 我 们 看 到 ， 如 果 我 们 使 用 一 个 自 
顶 向 下 的 过 程 ， 实 际 上 是 对 红 黑 树 应 用 从 项 向 下 保证 S 不 会 是 红 的 过 程 ， 则 伸展 树 会 更 
有 效 。 

这 个 过 程 在 概念 上 是 容易 的 。 在 向 下 的 过 程 中 当 我 们 看 到 一 个 节点 X 有 两 个 红 儿 子 
的 时 候 ， 我 们 让 X 成 为 红 的 而 让 它 的 两 个 儿子 是 黑 的 。 图 12-11 显示 这 种 颜色 翻转 的 现 
象 ， 只 有 当 X 的 父 节 点 已 也 是 红 的 时 候 这 种 翻转 将 破坏 红 黑 的 法 则 。 但 是 此 时 我 们 可 以 
应 用 图 12-10 中 适当 的 旋转 。 如 果 X 的 父 节点 的 兄弟 是 红 的 会 如 何 ? 这 种 可 能 已 经 被 从 
项 向 下 过 程 中 的 行动 所 排除 ， 因 此 X 的 父 节 点 的 兄弟 不 可 能 是 红 的 ! 特别 地 ， 如 果 在 沿 
树 向 下 的 过 程 中 我 们 看 到 一 个 节点 YY 有 两 个 红 儿 子 ， 那 么 我 们 知道 Y 的 孙子 必然 是 黑 的 ， 
由 于 Y 的 儿子 也 要 变 成 黑 的 ， 其 至 在 可 能 发 生 的 旋转 之 后 ， 因 此 我 们 将 不 会 看 到 两 层 上 
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另外 的 红 节 点 。 这 样 ， 当 我 们 看 到 X. AXWL REY, WX 的 父 节 点 的 兄弟 不 可 
能 也 是 红 的 。 


图 12-11 颜色 翻转 : RAS X 的 父 节 点 是 红 的 时 候 我 们 才能 继续 旋转 


例如 ， 假 设 我 们 要 将 45 插入 到 图 12-9 中 的 树 上 。 在 沿 树 向 下 的 过 程 中 ,我 们 看 到 50 
有 两 个 红 儿 子 。 因 此 ， 我 们 执行 一 次 颜色 翻转 ， 使 50 为 红 的 ，40 和 55 是 黑 的 。 现 在 50 和 
60 都 是 红 的 。 我 们 在 60 和 70 之 间 执 行 单 旋转 ， 使 得 60 是 30 的 右 子 树 的 黑 根 ， 而 70 和 50 
都 是 红 的 。 如 果 我 们 看 到 在 含有 两 个 红 儿 子 的 路 径 上 有 另外 一 些 节 点 ， 那 么 我 们 继续 ， 执 
行 同 样 的 操作 。 当 我 们 到 达 树 叶 时 ， 把 45 作为 红 节 点 插入 ， 由 于 父 节点 是 黑 的 ， 因 此 插入 
完成 。 最 后 得 到 的 树 如 图 12-12 所 示 。 
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图 12-12 将 45 插 入 到 图 12-9 中 


如 图 12-12 所 示 ， 所 得 到 的 红 黑 树 常 常平 衡 得 很 好 。 经 验 指出 ,平均 红 黑 树 大 约 和 平 
均 AVL 树 一 样 深 从 而 查找 时 间 一 般 接近 最 优 。 红 黑 树 的 优点 是 执行 插入 所 需要 的 开销 相 
对 较 低 ， 再 有 就 是 实践 中 发 生 的 旋转 相对 较 少 。 

红 黑 树 的 具体 实现 是 复杂 的 ， 这 不 仅 因 为 有 大 量 可 能 的 旋转 ， 而 且 还 因为 一 些 子 树 
可 能 是 空 的 (如 10 的 右 子 树 )， 以 及 处 理 根 的 特殊 的 情况 (尤其 是 根 没有 父亲 )。 因 此 ,我 
们 使 用 两 个 标记 节点 : 一 个 是 为 根 ， 一 个 是 NullNode， 它 的 作用 像 在 伸展 树 中 那样 是 指 
示 一 个 NULL 指针 。 根 标记 将 存储 关键 字 一 号 和 一 个 指向 真正 的 根 的 右 指针 。 为 此 ， 查 找 
和 打印 过 程 需要 调整 。 递 归 的 例 程 都 很 巧妙 。 我 们 使 用 一 个 隐藏 的 递归 过 程 ， 而 并 不 强 
迫 用 户 传 递 T>~Right。 因 此 用 户 不 必 关 心头 节点 。 图 12-13 指出 如 何 重新 编写 中 序 遍 历 。 

我 们 还 需要 使 用 户 调用 例 程 Initialize 来 指定 头 节点 。 如 果 构 造 的 是 第 一 棵 树 ， 那 
4 Initialize 应 该 再 为 NullNode 分 配 内 存 ( 其 后 的 树 可 以 分 享 Nu1l1Node)。 这 和 类 型 
声明 一 起 如 图 12-14 所 示 。 

接 下 来 ， 图 12-15 显示 执行 一 次 单 旋 转 的 例 程 。 因 为 得 到 的 树 必须 连接 到 父 节 点 上 ， 
所 以 Rotate 把 该 父 节 点 作为 一 个 参数 。 在 沿 着 树 下 行 的 时 候 ， 我 们 把 Item 作为 参数 传 
递 ， 而 不 是 跟踪 旋转 的 类 型 。 由 于 我 们 希望 插入 过 程 中 旋转 很 少 ， 因 此 这 么 做 实际 上 不 仅 
更 简单 ， 而 且 还 更 快 。Rotate 直接 返回 执行 相应 单 旋转 的 结果 。 





/* Print the tree, watch out for NullNode, */ 
/* and skip header */ 


static void 
DoPrint( RedBlackTree T ) 


ifC T != NullNode ) 

{ 
DoPrint( T->Left ); 
Output( T->Element ); 
DoPrint( T->Right ); 


} 

void 

PrintTree( RedBlackTree T ) 
{ 


} 


DoPrint( T->Right ); 











图 12-13 ”使 用 两 个 标记 对 树 的 中 序 遍 历 
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typedef enum ColorType { Red, Black } ColorType; 


struct RedBlackNode 

{ 
ElementType Element 
RedBlackTree Left; 
RedBlackTree Right; 
ColorType Color; 

h 


Position NullNode = NULL; /* Needs initialization */ 
/* Initialization procedure */ 

RedBlackTree 

Initialize( void ) 


RedBlackTree T; 


if( NullNode = NULL ) 
{ 


NullNode == malloc( sizeof( struct RedBlackNode ) ); 


ifC NullNode == NULL ) 

FatalError( "Out of space!!!" ); 
NullNode-»Left = NullNode-»Right = NullNode; 
NullNode-»Color = Black; 

NullNode-»Element = Infinity; 
} 


/* Create the header node */ 
T = malloc( sizeof( struct RedBlackNode ) ); 
ifC T == NULL ) 

FatalError( “Out of space!!!" ); 
T->Element = NegInfinity; 
T->Left = T->Right = NullNode; 
T->Color = Black; 


return T; 








图 12-14 ”类 型 声明 和 初始 化 
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最 后 ， 我 们 在 图 12-16 中 给 出 插入 过 程 。 当 我 们 遇 到 带 有 两 个 红 儿 子 的 节点 时 调用 例 
fi HandleReorient， 在 我 们 插入 一 片 树叶 时 也 调用 它 。 唯 一 复杂 的 部 分 是 ， 一 个 双 旋 转 
实际 上 是 两 个 单 旋 转 ， 而 且 只 有 当 通 向 X 的 分 支取 相反 方向 时 才 进 行 。 正 如 我 们 在 较 早 的 
讨论 中 提 到 的 ， 当 沿 树 向 下 进行 的 时 候 ，Insert 必须 记录 父亲 、 祖 父 和 曾祖 。 注 意 ， 在 一 
次 旋转 之 后 ， 存 储 在 祖父 和 曾祖 中 的 值 将 不 再 正确 。 不 过 ， 可 以 肯定 到 下 一 次 再 需要 它们 
的 时 候 它们 将 被 重新 存储 。 





/* Perform a rotation at node X */ 
/* (whose parent is passed as a parameter) */ 
/* The child is deduced by examining Item */ 


static Position 
Rotate( ElementType Item, Position Parent ) 


if( Item < Parent->Element ) | 
return Parent->Left = Item < Parent->Left->Element ? 
SingleRotateWithLeft( Parent->Left ) : 
SingleRotateWithRight( Parent-»Left ); 
else 
return Parent->Right = Item « Parent->Right->Element ? 
SingleRotateWithLeft( Parent->Right ) : 
SingleRotateWithRight( Parent->Right ); 








12-15 ”旋转 过 程 





static Position X, P, GP, GGP; | 


static | 
| void HandleReorient( ElementType Item, RedBlackTree T ) 
{ 

X->Color = Red; /* Do the color flip */ 

X->Left->Color = Black; 

X->Right->Color = Black; 


ifC P->Color == Red ) /* Have to rotate */ 
{ 
GP->Color = Red; 
if( (Item < GP->Element) != (Item < P->Element) ) 
P = Rotate( Item, GP ); /* Start double rotation */ 
X = Rotate( Item, GGP ); 
X->Color = Black; 
} 
T->Right->Color = Black; /* Make root black */ 
} 


RedBlackTree 
Insert( ElementType Item, RedBlackTree T ) 
{ 
X =P =GP=T; 
| NullNode--Element = Item; 
| while( X->Element != Item ) /* Descend down the tree */ 


{ 





GGP = GP; GP = P; P = X; 

if( Item < X->Element ) 
X = X->Left; 

else 
X = X->Right; 

if( X->Left->Color == Red && X->Right->Color == Red ) 
HandleReorient( Item, T ); 








图 12-16 插入 过 程 
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| } 
ifC X != NullNode ) 
return NullNode; /* Duplicate */ 


X = malloc( sizeof( struct RedBlackNode ) ); 
ifC X == NULL ) 

FatalError( "Out of space!!!" ); 
X-»Element - Item; 
X->Left = X->Right = NullNode; 


if( Item < P->Element ) /* Attach to its parent */ 
P->Left = X; 

else 
P->Right = X; 

HandleReorient( Item, T ); /* Color red; maybe rotate */ 





return T; 








图 12-16 (2) 


12.2.3 BIR FARR 


红 黑 树 中 的 删除 也 可 以 自 顶 向 下 进行 。 每 一 件 工作 都 归结 于 能 够 删除 一 片 树叶 。 这 是 
因为 ， 要 删除 一 个 带 有 两 个 儿子 的 节点 ， 我 们 用 右 子 树 上 的 最 小 节点 代替 它 ; 该 节点 必然 
最 多 有 一 个 儿子 ， 然 后 将 该 节点 删除 。 只 有 一 个 右 儿 子 的 节点 可 以 用 相同 的 方式 删除 ， 而 
只 有 一 个 左 儿 子 的 节点 通过 用 其 左 子 树 上 最 大 节点 替换 ， 然 后 可 将 该 节点 删除 。 注 意 ， 对 
于 红 黑 树 ， 我 们 使 用 的 方法 绕 过 带 有 一 个 儿子 的 节点 的 情形 ， 因 为 这 可 能 在 树 的 中 部 连接 
两 个 红色 节点 ， 为 红 黑 条 件 的 实现 增加 困难 。 

当然 ， 红 色 树 叶 的 删除 很 简单 。 然 而 ， 如 果 一 片 树 叶 是 黑 的 ,那么 删除 操作 会 复 
杂 得 多 ， 因 为 黑色 节点 的 删除 将 破坏 条 件 4。 解 决 方法 是 保证 从 上 到 下 删除 期 间 树 叶 
是 红 的 。 

在 整个 讨论 中 , S X 为 当前 节点 ， 工 是 它 的 兄弟 ,而 忆 是 它们 的 父亲 。 开 始 时 我 们 把 
树 的 根 涂 成 红色 。 当 沿 树 向 下 遍历 时 ， 我 们 设法 保证 X 是 红色 的 。 当 我 们 到 达 一 个 新 的 节 
点 时 ,我 们 要 确信 了 是 红 的 (归纳 而 言 ， 按 照 我 们 试图 保持 的 这 种 不 变性 ) 并 且 X RIT 4E 
的 (因为 我 们 不 能 有 两 个 相连 的 红色 节点 )。 存 在 两 种 主要 的 情形 。 

首先 ， 设 X 有 两 个 黑 儿 子 。 此 时 有 三 种 子 情况 ， 它 们 由 图 12-17 Br. WR T d$ 
两 个 黑 儿 子 ， 那 么 我 们 可 以 翻转 XxX、T 和 P 的 颜色 来 保持 这 种 不 变性 。 否 则 ,的 儿子 
之 一 是 红 的 。 根 据 这 个 儿子 节点 是 哪 一 个 ， 我 们 可 以 应 用 图 12-17 所 示 的 第 二 和 第 三 种 
情形 表示 的 旋转 。 特 别 要 注意 ， 这 种 情形 对 于 树叶 将 是 适用 的 ， 因 为 NullNode 被 认为 
是 黑 的 。 

WX 的 儿子 之 一 是 红 的 。 在 这 种 情形 下 ， 我 们 落 到 下 一 层 上 ， 得 到 新 的 X、T 开 和 卫 。 


加 ”如果 两 个 儿子 都 是 红 的 ， 那 么 我 们 可 以 应 用 两 种 旋转 中 的 任意 一 种 。 通 常 ， 在 X 是 一 个 右 儿子 的 情形 下 存 
在 对 称 的 旋转 。 
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如 果 幸 运 ，X 落 在 红 儿 子 上 ， 则 我 们 可 以 继续 向 前 进行 。 如 果 不 是 这 样 ， 那 么 我 们 知道 T 
将 是 红 的 ， 而 X 和 尸 将 是 黑 的 。 我 们 可 以 旋转 工 和 已 ， 使 得 X 的 新 父亲 是 红 的 ; 当然 X 
和 它 的 祖父 将 是 黑 的 。 此 时 我 们 可 以 回 到 第 一 种 主 情况 。 
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图 12-17 4X 是 一 个 左 儿 子 并 有 两 个 黑 儿 子 的 三 种 情形 


12.3 人 确定 性 跳跃 表 


我 们 看 到 的 用 于 红 黑 树 的 一 些 想法 可 以 应 用 到 跳跃 表 以 保证 对 数 最 坏 情 形 操 作 。 在 这 
一 节 ， 我 们 描述 产生 数据 结构 的 最 简单 的 实现 方法 一 一 1-2-3 确定 性 跳跃 表 (deterministic 
skip list), 

回忆 第 10 童 讲 到 ， 一 个 跳跃 表 中 的 节点 随机 指定 了 高 度 。 高 度 为 h 的 节点 包含 h 个 前 
向 指针 pis pes cns Dos Di 指向 高 度 为 i 或 更 大 的 下 一 个 节点 。 一 个 节点 具有 高 度 h 的 概 
率 为 0.5"( 为 了 实现 时 / 空 交换 ，0.5 可 以 用 0 和 1.0 之 间 的 任何 数 来 代替 )。 因 此 ， 我 们 期 望 
只 处 理 一 些 前 向 指针 直到 下 降 一 层 ; 由 于 有 大 约 log N 层 ， 因 此 我 们 得 到 每 次 操作 O(log N) 
的 期 望 运 行 时 间 。 

为 使 这 个 界 成 为 最 坏 情 形 的 界 ， 我 们 需要 保证 只 有 常数 个 前 向 指针 需要 考察 直到 下 降 
到 更 低 的 一 层 。 为 此 ， 我 们 添加 一 个 平衡 条 件 。 首 先 需 要 两 个 定义 。 

EX: 如 果 至 少 存在 一 个 指针 从 一 个 元 素 指向 另 一 个 元 素 ， 称 两 个 元 素 是 链接 的 
(linked) 。 

EX: 两 个 在 高 度 为 h 链接 的 元 素 间 的 间隙 容量 (gap size) 等 于 它们 之 间 高 度 为 h 一 1 
的 元 素 的 个 数 。 
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1-2-3 确定 性 跳跃 表 满 足 这 样 的 性 质 : 每 一 个 间 际 ( 除 在 头 和 尾 之 间 可 能 的 零 间 隙 外 ) 
的 容量 为 1、2 或 3。 例如， 图 12-18 显示 一 个 1-2-3 确定 性 跳跃 表 。 有 两 个 容量 为 3 的 间 
Bi: 第 一 个 是 在 25 和 45 之 间 高 度 为 1 的 三 个 元 素 ， 第 二 个 是 在 表 头 和 尾 之 间 高 度 为 2 
的 三 个 元 素 。 尾 节点 包含 ce， 它 的 出 现 简 化 了 算法 并 使 得 定义 表 终 端 间隙 的 概念 更 
容易 。 
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图 12-18 一 个 1-2-3 确定 性 跳跃 表 


显然 ， 当 我 们 沿 任意 一 层 行进 仅仅 通过 常数 个 指针 然后 就 可 下 降 到 低 一 层 。 因 此 ， 在 
最 坏 的 情形 下 查找 的 时 间 是 O(log N). 

为 了 执行 插入 ， 我 们 必须 保证 当 一 个 高 度 为 疡 的 新 节点 加 入 进来 时 不 会 产生 具有 四 个 
高 度 为 h 的 节点 的 间隙。 实际 上 这 很 简单 ， 采 用 类 似 于 在 红 黑 树 中 所 做 的 自 顶 向 下 的 方法 
即 可 。 

设 我 们 在 第 二 层 上 ， 并 正 要 降 到 下 一 层 去 。 如 果 要 降 到 的 间隙 容量 是 3， 那 么 我 们 提 
高 该 间隙 的 中 间 项 使 其 高 度 为 上 ， 从 而 形成 两 个 容量 为 1 的 间隙。 由 于 这 使 得 朝向 删除 的 
道路 上 消除 了 容量 为 3 的 间隙 ， 因 此 插入 是 安全 的 。 

例如 ， 图 12-19 显示 项 27 到 图 12-18 的 确定 性 跳跃 表 中 的 插入 操作 。 在 头 节 点 ,我 们 
将 要 从 第 3 层 降 到 第 2 层 。 由 于 下 降 将 落 到 容量 为 3 的 间隙 ， 因 此 这 里 的 中 项 (25) 将 上 升 
到 高 度 3 并 在 表 中 拼接 好 。 在 第 2 层 的 查找 将 我 们 带 到 25， 我 们 需要 在 此 处 下 降 到 第 1 层 。 
在 这 里 又 见 到 容量 为 3 的 间隙 ， 因 此 把 35 提升 到 高 度 2。 结 果 如 图 12-20 所 示 。 当 插入 27 
的 时 候 ， 将 它 接 到 表 中 ， 如 图 12-21 所 示 。 
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12-20 1827: 其 次 ， 通 过 提升 35 将 含 3 个 高 度 1 的 节点 的 间隙 分 裂 
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图 12-21 插入 27: 最 后 ， 将 27 作为 高 度 为 1 的 节点 插入 








删除 的 困难 出 现在 间隙 容量 为 1 的 情况 。 当 我 们 看 到 将 要 下 降 到 一 个 容量 为 1 的 间 院 
时 ,我 们 把 这 个 间隙 放大 : 或 者 是 通过 从 相 邻 间隙 (如 果 容 量 不 为 1) 借 来 的 方式 ， 或 者 通过 
降低 该 间隙 与 邻 间隙 分 开 的 节点 的 高 度 的 方式 。 由 于 这 两 个 都 是 容量 为 1 的 间隙 ， 因 此 结 
果 变 成 容量 为 3 的 间隙。 由 于 有 几 种 情形 要 人 处理， 因此 程序 比 我 们 的 描述 稍微 复杂 一 些 。 

整个 过 程 是 如 何 实现 的 呢 ? 在 描述 了 所 有 的 细节 之 后 ， 我 们 将 看 到 程序 代码 的 量 实际 
上 是 相当 小 的 。 

第 一 个 重要 的 细节 是 ， 当 我 们 将 一 个 高 的 节点 提升 到 高 h 十 1 的 时 候 ， 我 们 不 能 花费 
时 间 O04) 用 于 将 hh 个 指针 拷贝 到 一 个 新 数组 。 否则， 插入 的 时 间 界 就 要 成 为 OClog NO T. 
一 种 合理 的 方法 是 用 一 个 链表 表示 高 度 为 h 的 节点 中 的 h 个 前 向 指针 。 由 于 我 们 是 沿 着 各 
层 向 下 行进 ， 因 此 一 个 节点 的 链表 是 以 第 及 层 前 向 指针 开始 并 以 第 1 层 前 向 指针 结束 。 

第 二 是 优化 更 复杂 而 且 可 能 占用 一 些 空间 。 我 们 不 是 把 节点 作为 一 项 和 前 向 指针 的 链 
表 来 存储 ， 而 是 存储 前 向 指针 和 前 向 项 对 的 链表 。 理 解 其 含义 的 最 容易 的 方法 是 参考 
图 12-22， 它 是 图 12-21 的 另 一 种 表示 方法 。 我 们 将 使 用 术语 抽象 表示 或 远 辑 表示 来 描述 
图 12-21 并 把 图 12-22 当 作 是 (实际 的 ) 实 现 方 法 。 
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12-22 12-21 中 1-2-3 确定 性 跳跃 表 的 链表 实现 


首先 注意 ， 除 了 尾 节 点 被 删除 外 ， 抽 象 表示 和 实际 实现 二 者 的 地 平 线 (skyline 一 一 即 我 
们 从 左 到 右 扫描 的 高 度 ) 是 一 样 的。 在 我 们 的 实现 中 ， 每 一 个 节点 都 留 有 使 我 们 下 降 一 层 的 
指针 、 指 向 同 层 上 的 下 一 个 节点 的 指针 以 及 逻辑 上 存储 在 下 一 项 中 的 项 (如 原始 抽象 描述 
所 述 ) 。 

注意 ， 有 些 项 的 出 现 是 多 于 一 次 的 : 例如 ，25 出 现在 三 个 地 方 。 事 实 上 ， 如 果 一 个 节 
点 在 抽象 表示 中 的 高 度 为 h， 那 么 它 的 项 在 实际 实现 中 就 会 出 现在 h 个 地 方 。 有 一 些 重要 的 
结论 和 惊人 的 结果 将 在 给 出 实现 方法 后 进行 解释 。 

基本 节点 由 一 个 关键 字 和 两 个 指针 组 成 。 为 了 使 编程 更 快 更 简单 ， 我 们 使 用 了 一 个 尾 
节点 ; 如 果 不 能 够 或 不 希望 赋值 2 ， 那 么 就 必须 用 到 别 的 技巧 。 我 们 对 头 节 点 和 底层 节点 
都 有 一 个 标记 以 代替 NULL 指针 。 声 明和 初始 化 的 例 程 如 图 12-23 所 示 。 

查找 函数 与 随机 化 跳跃 表 中 的 相同 。 图 12-24 指出 ， 如 果 我 们 得 不 到 匹配 的 项 ， 那 么 
或 者 向 下 进行 ， 或 者 向 右 进行 ,这 依赖 于 比较 的 结果 。 如 图 12-25 所 示 ， 插 入 操作 由 于 标 
记 的 引入 而 大 大 简化 。 利 用 某 些 烦琐 的 指针 跟踪 我 们 可 以 看 到 ， 如 果 不 得 不 对 每 一 个 指针 
是 否 是 NULL 进行 测试 ,那么 我 们 就 会 很 容易 地 将 程序 代码 增加 三 倍 。 
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struct SkipNode 


{ 
ElementType Element; 
SkipList Right; 
SkipList Down; 

h 


static Position Bottom = NULL; /* Needs initialization */ 
static Position Tail - NULL; /* Needs initialization */ 


/* Initialization procedure */ 








SkipList 
Initialize( void ) 


SkipList L; 


if( Bottom == NULL ) 





{ 
Bottom = malloc( sizeof( struct SkipNode ) ); 
if( Bottom == NULL ) 
FatalError( "Out of space!!!" ); 
Bottom->Right = Bottom->Down = Bottom; 
Tail = malloc( sizeof( struct SkipNode ) ); 
if( Tail == NULL ) 
FatalError( "Out of space!!!" ); 
Tail->Element = Infinity; 
Tail->Right = Tail; 
} 


/* Create the header node */ 
L = malloc( sizeof( struct SkipNode ) ); 
if( L == NULL ) 

FatalError( "Out of space!!!" ); 
L->Element = Infinity; 
L->Right = Tail; 
L->Down = Bottom; 





return L; 


! 


图 12-23 ”确定 性 跳跃 表 : 类 型 和 初始 化 ( 均 不 在 头 文件 中 ) 











图 12-25 指出 ， 确 定性 跳跃 表 插 和 人 过 | 
程 的 程序 多 多 少 少 短 一 些 ， 考 虑 的 情况 比 | fe oe Bottom if not found */ n9 Eten, */ 
红 黑 树 少 得 多 。 我 们 所 付出 的 代价 似乎 是 Position 
空间 ， 在 最 坏 情 况 下 我 们 有 2N 个 节点 ， ElementType Item, SkipList L ) | 


每 个 节点 包含 两 个 指针 和 一 项 。 对 于 红 黑 We 

A NAME AA Bottom->Element = Item; 
树 ， 我 们 有 N 个 节点 ， 每 个 节点 包含 两 while( Item != Current->Element ) 
个 指针 、 一 项 以 及 一 个 颜色 位 。 因此 ， 我 if( Item < Current->Element ) 


Current = Current->Down; 


们 可 能 要 用 到 两 倍 多 的 空间 。 可 是 ， 事 情 elsé 
没有 糟 到 这 一 步 。 首 先 ， 经验 指 出 ， 确 定 
性 跳跃 表 平 均 使 用 大 约 1.57N 个 节点 。 | } 
其 次 ， 在 某 些 情况 下 ， 确 定性 跳跃 表 实际 
使 用 的 空间 少 于 红 黑 树 。 

这 里 有 一 个 实际 的 例子 。 在 32 位 机 上 ， 指 针 和 整数 是 4 字 节 。 对 于 某 些 系统 ， 包 括 某 些 版 


Current = Current->Right; 


return Current; 








图 12-24 确定 性 跳跃 表 : Find 例 程 
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本 的 UNIX， 内 存 是 按 块 (chunk) 来 配置 的 ， 它 们 通常 是 2 pm. 但 存储 管理 程序 使 用 4 字 节 的 
块 。 于 是 ， 对 于 12 字 节 的 请 求 将 得 到 一 个 16 字 节 块 : 12 字 节 由 用 户 使 用 而 4 字 节 作为 系统 开 
Hi. 但是， 对 于 13 字 节 的 需求 则 必须 提供 一 个 32 字 节 块 。 因 此 ， 在 这 种 情况 下 ， 确 定性 跳跃 表 
每 个 节点 使 用 16 字 节 ， 而 平均 有 1. 57N 个 节点 ， 故 总 数 一 般 约 为 25N 字 节 。 可 是 ， 红 黑 树 却 使 
470, 用 32N 字 节 ! 这 说 明 在 某 些 机 器 上 一 个 附加 位 是 非常 昂贵 的 ， 这 是 自 组 织 结构 的 吸引 力 之 一 。 





472 SkipList | 
Insert( ElementType Item, SkipList L ) 
{ 

Position Current = L; 

Position NewNode; 


Bottom-»Element 
while( Current ! 


{ 


Item; 
Bottom ) 


while( Item > Current->Element ) | 
Current = Current->Right; 


/* If gap size is 3 or at bottom level */ 

/* and must insert, then promote the middle element */ 

ifC Current->Element > 
Current->Down->Right->Right->Element ) 

{ 


NewNode = malloc( sizeof( struct SkipNode ) ); 
if( NewNode == NULL ) 
FatalError( "Out of space!!!" ); 
NewNode->Right = Current->Right; 
NewNode->Down = Current->Down->Right->Right; 
Current->Right = NewNode; 
NewNode->Element = Current->Element; 
Current->Element = Current->Down->Right->Element; 
} 
else 
Current = Current->Down; 


/* Raise height of DSL if necessary */ 

if( L->Right != Tail ) 

{ 
NewNode = malloc( sizeof( struct SkipNode ) ); 
if( NewNode == NULL ) 

FatalError( "Out of space!!!" ); | 
NewNode->Down = L; 
NewNode->Right = Tail; 
NewNode->Element = Infinity; 
L = NewNode; 


} 


return L; 











[473 | 图 12-25 ”确定 性 跳跃 表 : MATE 


确定 性 跳跃 表 的 性 能 似乎 比 红 黑 树 要 强 。 当 寻找 插入 时 间 的 改进 时 ， 下 面 这 行 代码 : 


if(Current —>Element >Current —>Down —> Right —>Right —>Element) 


很 好 ?， 如 果 我 们 把 一 些 项 存储 在 三 个 元 素 的 一 个 数组 中 ,那么 对 于 第 三 项 的 访问 可 以 直接 





O 事实 上 , 更 “明显 ”的 测试 
Current —>Element = = Current —>Down —> Right —>Right —>Right —>Element 
对 某 些 系统 多 花费 20% 的 时 间 ! 
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进行 ， 而 不 用 再 通过 两 个 Right 指针 。 图 12-26 表示 的 是 所 得 到 的 结构 ， 这 个 结构 很 像 第 
4 章 讨 论 的 B 树 。 我 们 称 之 为 1-2-3 确定 性 跳跃 表 的 水 平 数组 实现 (horizontal array imple- 
mentation) 。 正 如 存在 链表 形式 和 水 平 数组 形式 的 高 阶 B 树 一 样 ， 我 们 也 有 这 两 种 形式 的 
高 阶 确定 性 跳跃 表 。 哪 种 方法 最 好 还 有 竺 研究， 可 能 紧密 依赖 于 特定 的 系统 和 应 用 。 
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图 12-26 图 12-22 的 水 平 数 组 实现 


因为 大 量 可 能 的 旋转 ， 红 黑 树 的 编程 相当 复杂 ， 特 别 是 删除 操作 。 确 定性 跳跃 表 的 编 
程 虽 在 一 定 程 度 上 要 少 一 些 ， 但 仍然 是 相当 复杂 的 ， 这 由 所 需 的 三 个 标记 可 以 看 出 。 当 然 ， 
确定 性 跳跃 表 中 的 删除 是 一 项 非 平 凡 的 工作 。 在 这 一 节 ， 我 们 描述 二 又 B Mf (binary B-tree) 
一 种 简单 但 却 颇具 竞争 力 的 实现 方法 ， 这 种 树 叫 作 BB 树 。BB 树 是 带 有 一 个 附加 条 件 的 红 
黑 树 : 一 个 节点 最 多 可 以 有 一 个 红 儿 子 。 为 使 编程 容易 ， 我 们 采纳 一 些 法 则 。 
1. 首先 ， 我 们 加 入 只 有 右 儿 子 可 以 是 红 的 的 条 件 ， 这 就 消除 了 约 一 半 的 可 能 重新 构建 
的 情形 。 它 也 消除 在 删除 算法 中 一 个 恼人 的 情形 : 如 果 一 个 内 部 节点 只 有 一 个 儿 
T. 那么 这 个 儿子 一 定 是 右 儿 子 ( 它 刚好 是 红色 的 )， 因 为 黑色 左 儿 子 将 会 违反 红 黑 
树 的 条 件 4。 因 此 ， 我 们 总 可 以 用 一 个 内 部 节点 的 右 子 树 中 的 最 小 节点 代替 该 内 部 
TA. 
2. 我 们 递归 地 编写 这 些 过 程 。 
3. 我 们 把 信息 存在 一 个 短 整 (short) 型 数 ( 例 如 8 位 ) 中 ， 而 不 是 把 一 个 颜色 位 和 每 个 
节点 一 起 存储 。 这 个 信息 就 是 节点 的 层次 (level) 。 节 点 的 层次 : 
e 是 1( 若 该 节点 是 树叶 ) 。 
e 是 它 的 父 节 点 的 层次 ( 若 该 节点 是 红 的 ) 。 
e 比 它 的 父 节 点 的 层次 少 1( 若 该 节点 是 黑 的 ) 。 
如 此 得 到 的 结果 是 一 棵 AA 树 。 图 12-27 显示 用 于 AA 树 的 类 型 声明 。 我 们 再 一 次 使 用 
标记 来 代表 NULL. 
如 果 我 们 将 AA 结构 要 求 从 颜色 转换 成 层次 ， 那 么 我 们 看 到 ， 左 儿子 必然 比 它 的 父 节 
点 恰好 低 一 个 层次 ， 而 右 儿 子 可 能 比 父 节点 低 0 或 1 个 层次 (但 不 会 再 多 ).。 





/* Returned for failures */ 
Position NullNode = NULL; /* Needs more initialization */ 


struct AANode 


ElementType Element; 


AATree Left; | 
AATree Right; 
int Level; 

h 

AATree 


Initialize( void ) 





if( NullNode == NULL ) 
{ 


NullNode = malloc( sizeof( struct AANode ) ); 
ifC NullNode == NULL ) 

FatalError( "Out of space!!!" ); 
NullNode-»Left = NullNode-»Right = NullNode; 
NullNode-»Level = 0; 


} 
return NullNode; 





图 12-27 AAW: 某 些 类 型 声明 及 初始 化 


水 平 链接 (horizontal link) 是 一 个 节点 与 同 层次 上 的 儿子 之 间 的 连接 。 这 种 结构 需求 使 
得 水 平 链接 是 向 右 的 指针 ， 并 且 不 能 有 两 个 连续 的 水 平 链接 。 图 12-28 显示 一 棵 AA 树 的 示 
例 。 查 找 使 用 通常 的 算法 完成 。 一 个 新 项 的 插入 总 是 在 底层 进行 。 不 过 ， 有 两 个 问题 产生 : 
2 的 插入 将 产生 一 个 左 水 平 链接 ， 而 45 的 插入 将 产生 两 个 连续 的 右 水 平 链接 。 
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12-28 插入 10, 85, 15, 70, 20, 60, 30, 50, 65, 80, 90, 40, 5, 55, 35 得 到 的 一 棵 AA 树 


在 这 两 种 情况 下 一 次 单 旋转 都 可 以 使 问题 得 到 解决 : 通过 右 旋转 消除 左 水 平 链 接 ， 通 
过 左旋 转 消除 连续 的 右 水 平 链接 。 这 些 过 程 分 别 叫 作 Skew 和 Split. Fl 12-29 是 这 些 原 语 
的 代码 。 一 次 skew 除去 一 个 左 水 平 链接 ,但 可 能 会 创建 连续 的 右 水 平 链接 ， 因 此 我 们 首 
先 执行 Skew， 然 后 再 Split。 在 一 次 Split 之 后 ， 中 间 节 点 R 的 层次 增加 。 由 于 新 建 一 
个 左 水 平 节 点 或 连续 的 右 水 平 节点 ， 因 而 引起 X 的 原来 父 节点 的 一 些 问 题 ， 这 两 个 问题 都 
可 以 通过 上 滤 Skew/Split 的 方法 解决 。 如 果 我 们 使 用 递归 算法 ， 那 么 这 可 以 自动 地 完成 。 
图 12-30 描述 了 这 两 个 过 程 。 

将 45 插入 到 图 12-28 中 的 AA 树 的 动作 在 图 12-31 到 图 12-35 中 表示 。 此 时 的 插入 过 程 
只 比 非 平衡 实现 多 两 行 ， 如 图 12-36 所 示 。 

当然 ， 删 除 操作 是 更 复杂 的 ， 不过， 由 于 我 们 除去 了 许多 的 特殊 情况 ,程序 代码 实际 
上 是 相当 合理 的 。 首先， 我 们 记得 ， 如 果 一 个 节点 不 是 树叶 ， 那么 它 必然 有 一 个 右 儿 子 ， 
这 意味 着 ， 当 删除 一 个 节点 的 时 候 ， 我 们 总 可 以 用 其 右 子 树 上 最 小 的 儿子 代替 这 个 节点 ， 
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这 保证 它 是 在 第 一 层 上 。 





/* If T's left child is on the same level as T, */ 
/* perform a rotation */ 


AATree 
Skew( AATree T ) 
{ 
ifC T->Left->Level == T->Level ) 
T = SingleRotateWithLeft( T ); 
return T; 


} 


/* If T's rightmost grandchild is on the same level, */ 
/* rotate right child up */ 


AATree 

Split( AATree T ) 

{ 
ifC T->Right->Right->Level == T->Level ) 
{ 


T = SingleRotateWithRight( T ); 
T->Level++; 


} 


return T; 











图 12-29 AA 树 : Skew 过程 和 Split WHE 


右 旋 转 
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图 12-30 ”skew 和 Split。 注 意 R 的 层次 在 一 次 split 中 增加 








图 12-31 在 将 45 插入 到 示例 树 中 以 后 








图 12-32 在 35 处 进行 Split 之 后 
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图 12-33 在 50 处 skew 之 后 
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图 12-34 
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12-35 在 Skew70 和 Split30 后 最 后 得 到 的 树 


为 了 有 助 于 解决 问题 ， 我 们 使 用 了 
两 个 static 型 的 局 部 变量 DeletePtr 
和 LastPtr。 因 为 Remove 是 递归 过 程 ， 
所 以 这 两 个 变量 必须 是 static 型 。 当 
我 们 遍历 一 个 右 指针 时 , 我们 调整 
DeletePtr， 因 为 我 们 递归 地 调用 Re- 
move 直到 到 达 底 部 为 止 ( 在 沿 树 下 行 的 
过 程 中 我 们 不 对 相等 进行 测试 )， 这 保 
证 如 果 要 删除 的 项 在 树 上 ， 那 么 
DeletePtr 将 指向 包含 它 的 节点 。 
Last Ptr 指向 查找 终止 处 的 树叶 。 因 
为 我 们 只 有 到 达 底 部 才 停止 ， 所 以 如 果 
该 项 在 树 上 ， 那么 Last Ptr 将 指向 层 
次 为 1 的 包含 替换 值 的 节点 ， 且 必然 从 
该 树 中 删除 。 

当 到 达 树 的 底部 ， 我 们 执行 第 二 
步 ， 将 第 1 层 节 点 值 拷贝 到 内 部 节点 上 


日 ”这 个 技巧 可 以 用 于 Ping 过 程 ， 用 每 个 节点 的 两 路 比较 代替 在 每 个 节点 所 做 的 三 路 比较 ， 外 加 在 底部 进行 的 


相等 性 测试 。 








AATree 
Insert( ElementType Item, AATree T ) 


ifC T == NullNode ) 
{ 
/* Create and return a one-node tree */ 
T = malloc( sizeof( struct AANode ) ); 
If( T == NULL ) 
FatalError( "Out of space!!!" ); 
else 
( 
T->Element = Item; T->Level = 1; 
T->Left = T->Right = NullNode; 
} 
return T; 
} 
else 
ifC Item « T->Element ) 
T-»Left = Insert( Item, T->Left ); 
else 
ifC Item > T->Element ) 
T->Right = Insert( Item, T->Right ); 


/* Otherwise it's a duplicate; do nothing */ 


T = Skew( T ); 
T spec T 34 
return T; 





图 12-36 AAR: 插入 过 程 
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然后 调用 free 删除 层次 1 上 的 节点 。 
为 了 查看 是 否 那些 非 叶 节点 的 层次 被 一 次 递归 调用 所 破坏 ,需要 检查 这 些 非 叶 节点 。 


令 工 为 当前 节点 。 如 果 删 除 将 工 的 一 个 儿子 的 层次 (实际 上 只 有 一 个 由 递归 调用 所 输入 的 
儿子 可 能 受 影响 ， 但 为 简单 起 见 我 们 不 跟踪 T MEE 


它 ) 降 低 到 比 工 的 层次 低 2， 那 么 工 的 层次 也 
需要 降低 。 此 外 ， 如 果 工 有 一 个 右 红 儿子 ， ü 


A, 


a E 28 9 Ses 一 
( 3 F+(4) (6 )}+(7) 


那么 了 的 右 儿 子 也 必须 将 它 的 层次 降低 。 此 


图 12-37 3 1 被 删除 时 ， 引 入 水 平 左 链接 ， 所 


时 ， 我 们 可 能 在 同一 层次 上 有 6 个 节点 : T, 有 节点 的 层次 变 成 1。 通 过 调用 三 次 
TT 的 右 红 儿子 R，R 的 两 个 儿子 ， 以 及 这 些 Skew 使 得 右 指向 的 链接 完成 ， 调 用 两 
儿子 的 右 红 儿 子 。 图 12-37 表达 了 最 简单 的 aetna ere 
可 能 情况 。 

在 节点 1 删除 以 后 ， 节 点 2 从 而 节点 5 变 成 了 层次 为 1 的 节点 。 首 先 ， 我们 必须 调整 


在 节点 5 和 3 之 间 引 入 的 左 水 平 链接 。 这 基本 上 需要 两 次 旋转 (一 次 是 在 节点 5 和 3 之 间 ， 
而 后 是 在 节点 5 和 4 之 间 )。 在 这 种 情况 下 不 涉及 当前 节点 工 。 另 一 方面 ， 如 果 删 除 来 自 右 
边 ， 那 么 工 的 左 节点 忽然 之 间 就 可 能 变 成 水 平 的 了 ; 这 也 需要 一 次 类 似 的 双 旋 转 ( 在 工 开 
始 ) 。 为 了 避免 测试 所 有 这 些 情 形 ， 我 们 只 要 调用 三 次 skew 即 可 。 一 旦 调用 完成 ， 则 再 调 
用 两 次 Split 就 足以 重新 安排 这 些 水 平 的 边 。 整 个 删除 例 程 如 图 12-38 所 示 。 从 各 方面 来 


看 ， 这 对 编程 来 说 都 是 相对 简单 的 数据 结构 。 





{ 


{ 





AATree 
Remove( ElementType Item, AATree T ) 


static Position DeletePtr, LastPtr; 


ifC T != NullNode ) 


/* Step 1: Search down tree */ 
pe set LastPtr and DeletePtr */ 
LastPtr = T; 
if( Item < T->Element ) 

T->Left = Remove( Item, T->Left ); 
else 
{ 

DeletePtr = T; 

T->Right = Remove( Item, T->Right ); 
} 


/* Step 2: If at the bottom of the tree and */ 
f= item is present, we remove it */ 
ifC T == LastPtr ) 

{ 





if( DeletePtr != NullNode && 
Item == DeletePtr->Element ) 
{ 


DeletePtr->Element = T->Element; 
DeletePtr = NullNode; 

T = T->Right; 

free( LastPtr ); 








B] 12-38 AA 树 : 删除 过 程 
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/* Step 3: Otherwise, we are not at the bottom; */ 
/* rebalance */ 
else 
if( T->Left->Level < T->Level - 1 || 
T->Right->Level < T->Level - 1 ) 
{ 
if( T->Right->Level > --T->Level ) 
T->Right->Level = T->Level; 
T = Skew( T ); 
T->Right = Skew( T->Right ); 
T->Right->Right = Skew( T->Right->Right ); 
T = Split¢ T 5 
T->Right = Split( T->Right ); 
} 
} 
return T; 


} 











B] 12-38 () 


12.5 treap $} 


最 后 一 种 二 叉 查 找 树 可 能 是 最 简单 的 一 种 ， 叫 作 treap 树 。 它 像 跳 跃 表 一 样 使 用 随机 数 
并 且 对 任意 的 输入 都 能 给 出 O(log N) 的 期 望 时 间 的 性 能 。 查 找 时 间 等 同 于 非 平衡 二 又 查找 
树 ( 从 而 比 平衡 查找 树 要 慢 )， 而 插入 时 间 只 比 递归 非 平衡 二 又 查 找 树 的 实现 方法 稍 慢 。 虽 
然 删 除 操作 要 慢 得 多 ,但 仍然 是 O(log N) 期 望 时 间 。 

treap 树 是 如 此 简单 ， 以 致 我 们 不 用 画图 就 可 描述 它 。 树 中 的 每 个 节点 存储 一 项 、 一 个 
左 指 针 和 右 指 针 ， 以 及 一 个 优先 级 ， 该 优先 级 是 建立 节点 时 自动 指定 的 。 一 个 treap 树 就 是 
一 棵 二 又 查 找 树 ,但 其 节点 优先 级 满足 堆 序 性 质 : 任意 节点 的 优先 级 必须 至 少 和 它 父 亲 的 
优先 级 一 样 大 。 

其 每 一 项 都 有 不 同 优先 级 的 不 同 项 的 集合 只 能 由 一 个 treap 树 表 示 。 这 很 容易 由 归纳 法 
推导 ， 因 为 具有 最 低 优先 级 的 节点 必然 是 根 。 因 此 ， 树 是 根据 优先 级 的 IN Y 种 可 能 的 排列 
而 不 是 根据 项 的 N! 种 排序 形成 的 。 类 型 声明 很 简单 ， 只 要 求 Priority 域 的 加 法 。 标 记 
NullNode 的 优先 级 为 cc WA 12-39 所 示 。 





Treap 
Initialize( void ) 


ifC NullNode == NULL ) 
{ 


NullNode = malloc( sizeof( struct TreapNode ) ); 
if( NullNode == NULL ) 

FatalError( "Out of space!!!" ); 
NullNode-»Left = NullNode-»Right = NullNode; 
NullNode-»Priority = Infinity; 

} 
return NullNode; 


} 











图 12-39 treap 树 的 初始 化 


到 treap 树 的 插入 操作 也 简单 : 在 一 项 作为 树叶 加 入 之 后 ， 我 们 将 它 沿 着 该 treap BIS] 
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上 旋转 直到 它 的 优先 级 满足 堆 序 为 止 。 可 以 证 明 旋 转 的 期 望 次 数 小 于 2。 在 要 删除 的 项 找到 
以 后 ， 通 过 把 它 的 优先 级 增加 到 < 并 沿 着 低 优 先 级 诸 儿 子 的 路 径 向 下 旋转 而 可 将 其 删除 。 
一 旦 它 是 树叶 ， 就 可 以 把 它 除去 。 图 12-40 和 图 12-41 中 的 例 程 利用 递归 实现 这 些 方法 。 一 
种 非 递 归 的 实现 方法 留 给 读者 去 练习 (练习 12. 17) 。 对 于 删除 ,注意 当 节 点 逻辑 上 是 树叶 
时 ， 它 仍然 有 NullNode 作为 它 的 左 儿 子 和 右 儿 子 。 因 此 ， 它 与 右 儿 子 旋 转 ， 在 旋转 后 ， 
TT 为 Null1Node， 而 右 儿 子 可 以 被 释放 。 还 要 注意 我 们 的 实现 是 假设 没有 重复 元 ; 如 果 这 
个 假设 不 成 立 ， 那 么 Remove 可 能 失败 。( 为 什么 ?) 





Treap 
Insert( ElementType Item, Treap T ) | 


ifC T == NullNode ) 
{ 


/* Create and return a one-node tree */ 
T = malloc( sizeof( struct TreapNode ) ); 
TFC T == NULL ) 

FatalError( "Out of space!!!" ); 
else 


T->Element = Item; T->Priority = Random( ); 
T->Left = T->Right = NullNode; 
} 
} 
else 
if( Item < T->Element ) 
{ 
T->Left = Insert( Item, T->Left ); 
if( T->Left->Priority < T->Priority ) 
T = SingleRotateWithLeft( T ); 
} 
else 
if( Item > T->Element ) 
{ 
T->Right = Insert( Item, T->Right ); 
if( T->Right->Priority < T->Priority ) 
T = SingleRotateWithRight( T ); 
} 


/* Otherwise it's a duplicate; do nothing */ 


return T; 











图 12-40 treap Bj: 插入 例 程 


treap 树 特 别 容 易 实 现 是 因为 我 们 绝对 不 必 担 心 调整 优先 级 域 。 平 衡 树 处 理 方法 的 困难 
之 一 是 追查 由 于 未 能 更 新 一 次 操作 过 程 中 的 信息 而 导致 的 错误 。 从 那些 合理 的 插入 和 删除 
程序 包 中 的 所 有 程序 行 来 看 ，treap W (特别 是 以 非 递 归 方 法 实现 的 ) 似 乎 才 是 不 费力 的 
赢家 。 


12.6 k-d Bj 


设 一 家 广告 公司 拥有 一 个 数据 库 并 需要 为 某 些 客户 生成 邮寄 标签 。 典 型 的 要 求 可 能 是 
需要 散发 邮件 给 那些 年 龄 在 34 到 49 岁 之 间 且 年 收入 在 100 000 美元 和 150 000 美元 之 间 的 
人 们 。 这 个 问题 叫 作 二 维 范 围 查 询 (two-dimensional range query) 。 在 一 维 情况 下 ， 该 问题 
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可 以 借助 于 简单 的 递归 算法 通过 遍历 预先 构造 的 二 叉 查 找 树 以 OCM + log N) 平 均 时 间 解 决 。 
这 里 ，M 是 由 查询 所 报告 的 匹配 的 个 数 。 我 们 希望 对 二 维 或 更 高 维 的 情况 得 到 类 似 的 界 。 








| Treap 
Remove( ElementType Item, Treap T ) 
{ 
ifC T != NullNode ) 
| { 
| if( Item « T->Element ) 
T-»Left = Remove( Item, T->Left ); 
else 
if( Item > T->Element ) 
T->Right = Remove( Item, T->Right ); 
else 
{ 
/* Match found */ 
if( T->Left->Priority < T->Right->Priority ) 
T = SingleRotateWithLeft( T ); 
else 
T = SingleRotateWithRight( T ); 
ifC T != NullNode ) /* Continue on down */ 
T = Remove( Item, T ); 
else 
{ 
/* At a leaf */ 
free( T-»Left ); 
T-»Left - NullNode; 
} 
} 
} 
return T; 
} 











图 12-41 treap 树 : 删除 过 程 


二 维 查找 树 具 有 简单 的 性 质 :, 在 奇数 层 上 的 分 支 按照 第 一 个 关键 字 进 行 ， 而 在 偶数 层 

483| 上 的 分 支 按照 第 二 个 关键 字 进 行 。 根 是 任意 选取 的 奇数 层 ， 图 12-42 表示 一 棵 2-d 树 。 向 

! 一 棵 2-d 树 进行 的 插入 操作 是 向 一 棵 二 又 查找 树 插 入 操作 的 平凡 的 扩展 : 在 沿 树 下 行 时 ， 

| 我 们 需要 保留 当前 的 层 。 为 保持 程序 代码 简单 ， 我 们 假设 基本 的 项 是 两 个 元 素 的 数组 。 此 
时 我 们 需要 把 层 限 制 在 0 和 1 之 间 。 图 12-43 显示 的 是 执行 插入 的 程序 。 在 这 一 节 我 们 使 用 
递归 ， 用 于 实践 中 的 非 递归 实现 方法 是 简单 的 ， 我 们 把 它 留 作 练 习 12. 23 。 特 别 是 由 于 若干 
项 在 一 个 域 中 可 能 相同 ， 因 此 困难 之 一 是 重复 元 。 我 们 的 程序 允许 重复 元 ， 且 总 是 把 它们 
放 在 右 分 支 上 ， 显 然 ， 如 果 有 太 多 的 重复 元 ， 那么 这 可 能 就 是 一 个 问题 。 
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图 12-42 2-d 树 示 例 
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static KdTree 
RecursiveInsert( ItemType Item, KdTree T, int Level ) 
{ 
ifC T == NULL ) 
{ 
T = malloc( sizeof( struct KdNode ) ); 
ifC T == NULL ) 
FatalError( "Out of space!!!" ); 
T-»Left = T->Right = NULL; 
T-»Data[ 0 ] = Item[ 0 ]; 
T-»Data[ 1 ] = Item[ 1 ]; 
} 
else 
if( Item[ Level ] < T->Data[ Level ] ) 
T->Left = RecursiveInsert( Item, T->Left, !Level ); 
else 
T->Right = RecursiveInsert( Item, T->Right, !Level ); 
return T; 


} 


KdTree 
Insert( ItemType Item, KdTree T ) 


return RecursiveInsert( Item, T, 0 ); 











图 12-43 向 2-d 树 进 行 的 插入 


稍 加 思索 便 可 确信 ， 一 棵 随机 构造 的 2-d 树 与 一 棵 随机 二 又 查找 树 具 有 相同 的 结构 性 
fat: 高 度 平 均 为 O(log N) ， 但 最 坏 情 形 则 是 ON). 

不 像 二 又 查找 树 有 精巧 的 O(log N) 最 坏 情 形 的 变种 存在 ， 没 有 已 知 的 方案 能 够 保证 一 
棵 平衡 的 2-d 树 。 问 题 在 于 ， 这 样 一 种 方案 很 可 能 基于 树 的 旋转 ， 而 树 旋转 在 2-d 树 中 是 
行 不 通 的 。 我 们 能 够 做 的 最 好 的 办 法 是 通过 重新 构造 子 树 来 定期 地 对 树 进 行 平 衡 ， 具 体 描 
述 可 见 练习 3。 类似 地 ， 也 不 存在 超越 明显 的 懒惰 删除 方法 的 删除 算法 。 如 果 在 需要 处 理 查 
询 之 前 所 有 的 项 都 已 得 到 ， 那 么 我 们 就 能 够 以 O(N log N) 时 间 构 造 一 棵 理想 平衡 2-d 树 ， 
这 就 是 练习 12. 21c。 

有 几 种 查询 可 以 在 2-d 树 上 进行 。 我 们 可 以 要 求 精确 的 匹配 ,或 者 基于 两 个 关键 字 中 
一 个 关键 字 的 匹配 ; 后 者 称 为 部 分 匹配 查询 (partial match query)。 这 两 种 都 是 ( 正 交 ) 范 转 
查询 (range query) 的 特殊 情形 。 

正 交 范围 查询 给 出 其 第 一 个 关键 字 在 一 个 特殊 的 值 集合 之 间 且 第 二 个 关键 字 在 另 一 个 
特殊 的 值 集 合 之 间 的 所 有 的 项 。 这 正 是 我 们 在 本 节 介 绍 中 所 描述 的 问题 。 如 图 12-44 Bros. 
范围 查询 通过 一 次 递归 的 树 遍 历 容 易 解 出 。 通 过 在 递归 调用 之 前 进行 测试 ,我 们 可 以 避免 
对 所 有 节点 的 不 必要 的 访问 。 

为 找到 特定 的 项 ， 可 以 令 Low 和 High 等 于 我 们 要 查找 的 项 。 为 了 执行 一 次 部 分 匹配 
查询 ， 我 们 让 在 这 次 匹配 中 涉及 不 到 的 关键 字 的 范围 为 一 2 到 co。 其 余 范 围 设置 为 低 点 和 
高 点 等 于 匹配 中 所 涉及 的 关键 字 的 值 。 

在 2-d 树 中 插入 或 精确 匹配 查找 花费 的 时 间 平 均 正比 于 树 的 深度 ， 即 OClog N)， 而 在 
最 坏 情 形 下 为 O(N)。 一 次 范围 查找 的 运行 时 间 依 赖 于 如 何 将 树 平衡 ， 是 否 要 求 部 分 匹配 ， 
以 及 实际 上 有 多 少 项 被 找到 。 我 们 提出 三 个 结果 ,它们 已 经 得 到 证 明 。 
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/* Print items satisfying */ 
/* Low[ 0 ] <= Item[ 0 ] <= High[ 0 ] and */ 
/* Low[ 1] <= Item[ 1 ] <= High[ 1] */ 


static void 

RecPrintRange( ItemType Low, ItemType High, 
KdTree T, int Level ) 

{ 


ifC T != NULL ) 
{ 
ifC Low[ 0 ] <= T-»Data[ 0 ] && 
T->Data[ 0 ] <= High[ O ] && 
Low[ 1 ] <= T-»Data[ 1 ] && 
T-»Data[ 1 ] <= High[ 1] ) 
PrintItem( T-»Data ); 


ifC Low[ Level ] <= T-»Data[ Level ] ) 
RecPrintRange( Low, High, T->Left, !Level ); 
ifC High[ Level ] >= T-»Data[ Level ] ) 
RecPrintRange( Low, High, T->Right, !Level ); 
} 
} 


void 
PrintRange( ItemType Low, ItemType High, KdTree T ) 
{ 


RecPrintRange( Low, High, T, 0 ); 
} 











图 12-44 2-d 树 : 范围 查找 


对 于 理想 平衡 树 ， 一 次 范围 查询 要 报告 M 次 匹配 可 能 花费 最 坏 情形 时 间 OC M+ 
VN)。 在 任意 节点 ， 我 们 可 能 必须 访问 4 个 孙子 中 的 两 个 ， 于 是 成 立方 程 TCN) = 
2T(N/4) 十 O(1) 。 然 而 在 实践 中 ， 这 些 查找 趋向 于 非常 有 效 ， 甚 至 最 坏 情 形 都 不 是 那 
么 差 ， 因 为 对 于 典型 的 N， 在 VN 和 log N 之 间 的 差 被 隐藏 于 大 O 记 号 中 的 更 小 的 常数 
所 补偿 。 

对 于 随机 构造 的 树 ， 部 分 匹配 查询 的 平均 运行 时 间 为 O(M 十 N*)， 其 中 a 二 (一 3 十 
V17)/2( 见 下 面 )。 最 近 ， 令 人 震惊 的 结果 是 它 基 本 上 描述 了 随机 2-d 树 的 一 次 范围 查找 的 
平均 运行 时 间 。 

对 于 & 维 的 情况 ， 同 样 的 算法 仍然 成 立 ， 我 们 通过 每 层 上 的 那些 关键 字 进 行 循 环 。 不 
过 ， 在 实践 中 平衡 开始 变 得 越 来 越 差 ， 因 为 重复 元 和 非 随 机 输入 的 影响 一 般 变 得 更 为 明显 。 
我 们 把 编程 的 细节 留 给 读者 作为 练习 而 只 叙述 解析 结果 ， 对 于 理想 平衡 树 ， 一 次 范围 查询 
的 最 坏 情 形 运 行 时 间 为 OUQMT 二 AN “)。 在 随机 构造 的 k-d 树 中 ,涉及 k 个 关键 字 中 的 p 
个 关键 字 的 部 分 匹配 查询 花费 OC(M 十 N*)， 其 中 a 是 方程 

+a Ata) = 2 
(唯一 ) 的 正 根 。 对 各 种 DOBLE. a 的 计算 留 作 练习 ,k= 二 2 A p—1 的 值 反 映 在 上 面 对 于 随机 
2-d 树 的 部 分 匹配 所 叙述 的 结果 中 。 

虽然 有 几 种 新 奇 的 结构 支持 范围 查找 ,但 是 k-d 树 恐 怕 是 达到 可 接受 的 运行 时 间 的 最 

简单 的 结构 了 。 
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12.7 配对 堆 


我 们 考察 的 最 后 一 个 数据 结构 是 配对 堆 (pairing heap)。 配 对 堆 的 分 析 问 题 仍 然 未 解决 ， 
不 过 ， 当 需要 DecreaseKey 操作 的 时 候 ， 它 似乎 胜 过 其 他 的 堆 结 构 。 使 其 高 效 最 可 能 的 
原因 是 它 的 简单 性 。 配 对 堆 可 表示 成 堆 序 树 。 图 12-45 显示 一 个 配对 堆 示 例 。 
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图 12-45 示例 配对 堆 : 抽象 表示 法 


配对 堆 的 具体 实现 用 到 第 4 章 中 所 讨论 的 左 儿 子 、 右 兄弟 表示 方法 。 我 们 将 看 到 ，De- 
creaseKey 操作 要 求 每 个 节点 包含 一 个 额外 的 指针 。 作 为 最 左 儿子 的 节点 含有 一 个 指向 其 
父亲 的 指针 ; 否则 这 个 节点 就 是 一 个 右 兄弟 并 含有 一 个 指向 它 的 左 兄弟 的 指针 。 我 们 将 把 
这 个 域 叫 作 Prev 域 。 为 了 简洁 ,我 们 省 去 类 型 声明 ， 这 些 类 型 声明 是 完全 直观 的 。 
图 12-46 指出 图 12-45 中 的 配对 堆 的 实际 表示 。 
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图 12-46 ”前 面 的 配对 堆 的 实际 表示 


我 们 以 概述 基本 操作 开始 。 为 了 合并 两 个 配对 堆 ， 我 们 使 具有 较 大 根 的 堆 成 为 具有 较 
小 根 的 堆 的 左 儿子 。 当 然 ， 插 入 是 合并 的 特殊 情形 。 为 执行 一 次 DecreaseKey， 我 们 降低 
所 需要 的 节点 的 值 。 因 为 对 于 所 有 的 节点 都 不 保存 父 指针 ， 所 以 我 们 不 知道 这 是 否 会 破坏 
堆 序 。 如 此 ， 我们 将 调整 后 的 节点 从 它 的 父 节 点 切除 ， 通过 合并 所 得 到 的 两 个 堆 而 完成 
DecreaseKey 操作 。 为 了 执行 DeleteMin. 我 们 将 根除 去 ， 得 到 堆 的 一 个 集合 。 如 果 根 
有 个 儿子 ,那么 对 合并 过 程 进行 c 一 1 次 调用 将 该 堆 重建 。 这 里 ， 最 重要 的 细节 就 是 用 于 
执行 合并 的 方法 以 及 如 何 应 用 c 一 1 次 合 

图 12-47 显示 如 何 将 两 个 子 堆 合 并 。 这 个 过 程 可 被 推广 到 允许 第 二 个 子 堆 有 兄弟 的 情 
形 。 我 们 早先 提 到 过 ， 可 以 让 具有 较 大 根 的 子 堆 成 为 另 一 个 子 堆 的 最 左 的 儿子 。 程 序 很 简 L489 | 
单 ， 如 图 12-48 所 示 。 注 意 ， 我 们 有 几 个 例子 ， 在 这 些 例子 中 ， 在 给 指针 赋予 Prev 域 之 前 
要 测试 它 是 否 是 NULL。 这 使 我 们 想到 ， 有 一 个 NullNode 标记 或 许 是 有 用 的 ， 它 习惯 上 放 
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在 这 一 章 的 查找 树 的 实现 中 。 
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图 12-47 CompareAndLink G@# H+ FHE 





/* This is the basic operation to maintain order */ 

/* Links First and Second together to satisfy heap order */ 
/* Returns the resulting tree */ 

/* First is assumed NOT NULL */ 

/* First->NextSibling MUST be NULL on entry */ 


Position 
CompareAndLink( Position First, Position Second ) 
{ 
if( Second == NULL ) 
return First; | 
else 
if( First->Element <= Second->Element ) 
{ 
/* Attach Second as the leftmost child of First */ 
Second->Prev = First; | 
First->NextSibling = Second->NextSibling; 
if( First->NextSibling != NULL ) 
First->NextSibling->Prev = First; 
Second->NextSibling = First->LeftChild; 
if( Second->NextSibling != NULL ) 
Second->NextSibling->Prev = Second; 
First->LeftChild = Second; 
return First; 
} 
else 
{ 
/* Attach First as the leftmost child of Second */ 
Second->Prev = First->Prev; 
First->Prev = Second; 
First->NextSibling = Second->LeftChi ld; 
if( First->NextSibling != NULL ) 
First->NextSibling->Prev = First; 
Second->LeftChild = First; 
return Second; 











图 12-48 ”配对 堆 : 合并 两 个 子 堆 的 例 程 


Insert 和 DecreaseKey 操作 是 抽象 描述 的 简单 实现 。DecreaseKey 需要 一 个 Posi- 
tion 对 象 。 由 于 一 项 的 Position 在 它 第 一 次 插入 时 被 确定 (不 可 改变 )， 因 此 Insert 通过 
第 三 个 参数 Loc 把 Position 送 回 给 调用 者 ，Loc 由 参考 值 传递 。 程 序 如 图 12-49 所 示 。 如 果 
新 的 关键 字 值 不 小 于 老 的 ， 那 么 Decreasekey 的 例 程 显示 警告 信息 。 在 这 种 情况 下 ， 最 后 得 
到 的 结构 可 能 不 遵守 堆 序 。 基 本 的 DeleteMin 过 程 由 抽象 描述 直接 得 到 ， 如 图 12-50 所 示 。 








/* Insert Item into pairing heap H */ 

/* Return resulting pairing heap */ 

/* A pointer to the newly allocated node */ 

| /* is passed back by reference and accessed as *Loc */ 


PairHeap 
Insert( ElementType Item, PairHeap H, Position *Loc ) 


{ 


Position NewNode; 


NewNode = malloc( sizeof( struct PairNode ) ); 
if( NewNode == NULL ) 

FatalError( "Out of space!!!" ); 
NewNode->Element = Item; 
NewNode->LeftChild = NewNode->NextSibling = NULL; 
NewNode->Prev = NULL; 





*Loc = NewNode; 
if( H == NULL ) 
return NewNode; 


| 
| 

| else 
| return CompareAndLink( H, NewNode ); 


/* Lower item in Position P by Delta */ 


PairHeap 
DecreaseKey( Position P, ElementType Delta, PairHeap H ) 


if( Delta < 0 ) 
Error( "DecreaseKey called with negative Delta" ); 


P->Element -- Delta; 
ifC P =H) 
return H; 


if( P->NextSibling != NULL ) 
P->NextSibling->Prev = P-»Prev; 

if( P->Prev->LeftChild == P ) 

| P->Prev->LeftChild = P->NextSibling; 

| else 

| P->Prev->NextSibling = P->NextSibling; 


| P->NextSibling = NULL; 
| return CompareAndLink( H, P ); 








图 12-49 配对 堆 : Insert #1 DecreaseKey 





PairHeap 
DeleteMin( ElementType *MinItem, PairHeap H ) 
Dn 
Position NewRoot = NULL; | 
| if( IsEmpty( H ) ) 
| Error( "Pairing heap is empty!" ); 
else 
1 
*MinItem = H->Element; 
ifC H-»LeftChild != NULL ) 
NewRoot = CombineSiblings( H->LeftChild ); 
free( H ); 


} | 
return NewRoot; | 





图 12-50 配对 堆 : DeleteMin 
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当然 ， 麻 烦 在 于 一 些 细 节 上 : CombineSiblings 如 何 实现 ? 已 经 提出 几 种 变 体 ， 但 
是 都 不 能 证 明 它 们 能 够 提供 如 斐 波 那 契 堆 那 样 相同 的 挫 还 界 。 即 使 这 样 ， 对 于 涉及 大 量 
DecreaseKey 操作 的 一 般 图 论 应 用 来 说 ， 图 12-51 中 的 方法 似乎 总 是 和 其 他 堆 结 构 一 样 运 
行 ， 甚 至 比 它们 (包括 二 叉 堆 ) 还 好 。 








/* Assumes FirstSibling is NOT NULL */ 


|  PairHeap 

CombineSiblings( Position FirstSibling ) 

{ 

| static Position TreeArray[ MaxSiblings ]; 
int i, j, NumSiblings; 


/* If only one tree, return it */ 
ifC FirstSibling->NextSibling == NULL ) 
return FirstSibling; 


/* Place each subtree in TreeArray */ 

for( NumSiblings = 0; FirstSibling != NULL; NumSiblings++ ) 

{ 
TreeArray[ NumSiblings ] = FirstSibling; 
FirstSibling->Prev->NextSibling = NULL; /* Break links */ 
FirstSibling = FirstSibling->NextSibling; 

} 

TreeArray[ NumSiblings ] = NULL; 


/* Combine the subtrees two at a time, */ 
/* going left to right */ 
for( i = 0; i + 1 < NumSiblings; i += 2 J 

TreeArray[ i ] = CompareAndLink( 
| TreeArray[ i ], TreeArray[ i +1] ); 
/* j has the result of the last CompareAndLink */ 
/* If an odd number of trees, get the last one */ 
ja i ~ 25 
IFE = NumSiblings D» 

mairie j ] = CompareAndLink( 

TreeArray[ j ], TreeArray[ j + 2 1 ); 


/* Now go right to left, merging last tree with */ 
/* next to last. The result becomes the new last */ 
fg | J 9-2) Jj se) 
TreeArray[ j - 2 ] = CompareAndLink( 
TreeArray[ j - 2 ], TreeArray[ j 1 ); 


return TreeArray[ O ]; 











图 12-51 配对 堆 : 两 趟 合并 法 


这 种 方法 是 已 经 提出 的 许多 变形 方法 中 最 简单 和 最 实际 的 方法 ,我 们 称 之 为 两 趟 合并 法 
(two-pass merging)。 首 先 ， 我 们 从 左 到 右 扫 描 ， 合 并 诸 儿 子 对 ?。 在 第 一 次 扫描 之 后 ,我们 
有 一 半数 量 的 树 要 合并 。 然 后 执行 第 二 趟 扫描 ， 从 右 到 左 。 在 每 一 步 ， 我们 将 第 一 次 扫描 
剩 下 的 最 右边 的 树 和 当前 合并 的 结果 合并 。 例 如 ， 如 果 有 8 个 儿子 cc 到 cs， 那么 第 一 次 扫 
描 进 行 c 和 cs、cs 和 c4、ccs ie coy €; 和 cs 的 合并 。 结 果 得 到 di. di. di. dio RANAH 
合并 di 和 d, 执行 第 二 趟 扫描 ， 然 后 d: 和 这 个 结果 合并 ， 最 后 d 再 和 刚 得 到 的 结果 合并 。 

rein ei neh) 在 最 坏 情 形 下 ， 可 能 有 N 一 1 项 都 是 根 的 





O ”如果 有 奇数 个 儿子 我 们 必须 仔细 。 此 时 ， 将 最 后 一 个 儿子 与 最 右 合 并 的 结果 合并 以 完成 第 一 次 扫描 。 
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儿子 ， 因 此 这 个 数组 必然 很 大 。 

其 他 一 些 合并 方法 在 练习 中 讨论 。 唯 一 简单 的 而 且 容 易 发 现 缺 欠 的 合并 方法 是 从 左 到 
右 单 趟 合并 (练习 12. 35) 。 配 对 堆 是 “简单 即 更 好 ”的 一 个 很 好 的 例子 ， 并 且 似 乎 是 要 求 
DecreaseKey 或 Merge 操作 的 一 些 重要 应 用 所 选择 的 方法 。 


Q 总 结 


Q 练习 


« coo NOORA U N 一 


在 这 一 章 ， 我们 看 到 二 又 查 找 树 几 种 有 效 的 变种 。 自 顶 向 下 伸展 树 提供 O(log N) 摊 还 
HERE, 
基本 操作 的 O(log N) 最 坏 情 形 性 能 。 在 各 种 结构 之 间 的 交换 涉及 代码 复杂 性 、 删 除 的 简易 
性 以 及 不 同 的 查找 和 插入 的 开销 。 很 难说 哪 种 结构 是 明显 的 赢家 。 复 现 的 论题 包括 树 的 旋 
转 以 及 标记 节点 的 使 用 以 避免 对 NULL 指针 许多 恼人 的 测试 ， 若 不 标记 节点 则 这 些 测 试 原 
本 是 必 不 可 少 的 。 即 使 理论 的 界 不 是 最 优 的 ，k-d 树 还 是 给 出 了 执行 范围 查找 的 实际 方法 。 
最 后 ， 我 们 描述 配对 堆 并 将 配对 堆 编程 ， 它 似乎 是 最 实际 的 可 合并 的 优先 队列 ， 特 别 
是 当 需 要 DecreaseKey 操作 的 时 候 。 不 过 ， 经 验 的 结果 尚未 得 到 解析 方法 的 分 析 证 实 。 


一 — 
— O 


treap 树 给 出 O(log N) 随 机 化 的 性 能 ， 而 红 黑 树 、 确 定性 跳跃 表 和 AA 树 则 均 给 出 对 


证 明 上 自 顶 向 下 展开 的 挫 还 时 间 为 O(log N)。 

证 明 对 于 从 底 向 上 展开 存在 每 次 访问 需要 2 log N 次 旋转 的 访问 序列 。 

修改 伸展 树 以 支持 对 第 & 个 最 小 项 的 查询 。 在 确定 性 跳跃 表 中 如 何 处 理 ? 

从 经 验 上 比较 简化 的 从 顶 向 下 展开 和 原始 描述 的 从 顶 向 下 展开 。 

编写 关于 红 黑 树 的 删除 过 程 。 

证 明 红 黑 树 的 高 度 最 多 为 2 log N， 并 证 明 这 个 界 实质 上 不 能 再 降低 。 

证 明 每 一 棵 AVL 树 都 可 以 被 涂 成 红 黑 树 。 所 有 的 红 黑 树 都 是 AVL 树 吗 ? 

证 明 1-2-3 确定 性 跳跃 表 可 以 表示 成 2-3-4 树 ， 它 的 项 在 内 部 节点 以 及 树叶 上 。 

如 果 我 们 试图 插入 已 经 在 确定 性 跳跃 表 中 存在 的 项 ， 那 么 会 发 生 什么 情况 ? 
证 明 在 1-2-3 确定 性 跳跃 表 中 最 多 能 够 用 到 2N 个 节点 。 
我 们 可 以 用 C 语言 把 每 一 个 抽象 节点 表示 成 动态 分 配 的 前 向 指针 数组 以 代替 指针 链 
表 。 指 出 如 何 用 这 种 方法 实现 1-2-3 确定 性 跳跃 表 并 保持 每 个 操作 的 O(log N) 时 间 界 。 
写 出 关于 1-2-3 确定 性 跳跃 表 的 删除 过 程 。 
证 明 AA 树 中 天 于 删除 的 算法 是 正确 的 。 
给 出 AA 树 的 一 种 非 递 归 的 自 顶 向 下 实现 方法 。 将 其 与 课文 中 的 实现 方法 在 简单 性 
和 效率 方面 进行 比较 。 
递归 地 编写 出 Skew 过 程 和 Split 过 程 ， 使 得 对 删除 操作 每 个 过 程 只 需 调用 一 次 。 
AA 树 使 用 的 程序 代码 比 BB 树 少 多 少 行 ? 这 能 使 AA 树 更 快 吗 ? 
通过 使 用 一 个 栈 来 非 递 归 地 实现 treap 树 的 插入 例 程 。 这 种 努力 值得 吗 ? 
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12. 26 


12.:27 


12. 28 
12. 29 


通过 使 用 访问 次 数 作为 优先 级 并 在 每 次 访问 后 需要 时 执行 旋转 我 们 可 以 使 treap 树 
成 为 自 调整 的 结构 。 将 这 种 方法 和 随机 化 方法 进行 比较 。 或 者 ， 在 每 次 访问 一 项 X 
时 生成 一 个 随机 数 。 如 果 这 个 数 小 于 X 当前 的 优先 级 ， 那 么 就 用 它 作 为 X 的 新 的 
优先 级 (执行 相应 的 旋转 )。 

证 明 ， 如 果 把 项 排序 ， 那 么 即使 优先 级 并 未 排序 ，treap 树 也 可 以 以 线性 时 间 构 造 。 
不 用 NullNode 标记 实现 某 些 树 结 构 。 使 用 标记 可 以 节省 多 少 编程 工作 ? 

假设 对 于 每 个 节点 我 们 把 NULL 指针 的 个 数 存 储 在 它 的 子 树 中 ， 称 之 为 节点 的 权 
(weight)。 采 用 下 列 方法 : 如 果 左 子 树 和 右 子 树 的 权 相 差 超出 因子 2， 那 么 彻底 重 
建 根 在 该 节点 的 子 树 。 证 明 下 列 结论 : 

a. 我 们 能 够 以 O(S) 重 建 一 个 节点 ， 其 中 S 是 该 节点 的 权 。 

b. 该 算法 每 次 插 和 人 操作 的 摊 还 时 间 为 O(log N)。 

c. 我 们 能 够 以 OCS log S) 时 间 在 k-d 树 中 重建 一 个 节点 ， 其 中 S 是 该 节点 的 权 。 

d. 我 们 可 以 将 该 算法 用 于 k-d 树 ， 其 每 次 插入 的 代价 为 O(log N)。 
假设 我 们 对 任意 一 棵 2-4 树 调用 singleRotatewithLeft。 详 细 解 释 其 结果 不 再 
是 一 棵 可 用 的 2-d 树 的 全 部 原因 。 

实现 对 于 k-d 树 的 插入 和 范围 查询 。 不 要 使 用 递归 。 

对 于 对 应 于 二 3，4，5 的 P 的 值 ， 确 定 部 分 匹配 查询 的 时 间 。 

对 于 一 棵 理想 平衡 k-d 树 ， 求 出 课文 中 引用 的 一 次 范围 查询 ( 见 12.6 节 ) 的 最 坏 情 
形 运 行 时 间 。 

2-d 堆 (2-d heap) 是 允许 每 一 项 拥有 两 个 单个 关键 字 的 一 种 数据 结构 。DeleteMin 
操作 可 以 对 于 这 两 个 关键 字 中 的 任意 一 个 执行 。2-d 堆 是 具有 下 述 性 质 的 完全 二 又 
Bl: 对 于 偶数 深度 上 的 任意 节点 X. 存储 在 X 上 的 项 具有 它 的 子 树 上 最 小 的 #1 关 
键 字 ， 而 对 于 奇数 深度 上 的 任意 节点 X， 存 储 在 X 上 的 项 具有 它 的 子 树 上 最 小 的 # 
2 关键 字 。 

a. KT (1, 10), (2, 9), (3, 8), (4, 7), (5, OEMAR REN 2-d XE 
b. 如 何 找 出 具有 最 小 #1 关键 字 的 项 ? 

. 如 何 找 出 具有 最 小 #2 关键 字 的 项 ? 

. 给 出 一 个 将 一 新 的 项 插入 到 2-4 堆 中 的 算法 。 

e. 给 出 一 个 对 于 任意 关键 字 执 行 DeleteMin 操作 的 算法 。 

f. 给 出 一 个 以 线性 时 间 实 施 FixHeap 的 算法 。 

将 前 面 的 练习 推广 以 得 出 一 个 k-d 堆 ， 在 这 个 堆 中 每 一 项 都 可 有 k 个 单个 关键 字 。 
你 应 该 能 够 得 到 下 列 的 界 : 以 O(log N) 实 施 Insert, 以 O(2* log N) 实 施 Delet- 
eMin， 以 及 以 O(RN) A FixHeap. 

证 明 k-d 堆 可 以 用 于 实现 双 端 优先 队列 。- 

抽象 地 推广 k-d 堆 使 得 只 有 那些 根据 关键 字 1 分 支 的 层 有 两 个 儿子 (所 有 其 他 层 都 
有 

a. 我 们 需要 指针 吗 ? 
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b. 显然 ， 那 些 基 本 算法 仍然 有 效 ， 它 们 的 新 的 时 间 界 是 多 少 ? 
12.30 ”使 用 k-d 树 实现 DeleteMin。 对 于 随机 树 ， 你 期 望 其 平均 运行 时 间 是 多 少 ? 
12.31 使 用 k-d 堆 实现 双 端 队列 (练习 3.26), 该 队列 也 支持 DeleteMin。 
12.32 ”使 用 一 个 NullNode 标记 实现 配对 堆 。 











xx12. 33 ”证 明 ， 对 于 课文 中 的 配对 堆 算 法 ， 每 次 操作 的 摊 还 时 间 为 O(log N)。 


12.34 CombineSiblings 的 另 一 种 方法 是 把 所 有 的 兄弟 都 放 到 一 个 队列 中 ， 并 反复 De- 
queue 及 合并 队列 中 的 前 两 项 ， 把 结果 放 到 队 尾 。 实 现 这 种 方法 。 

12.35 在 前 面 的 练习 中 不 用 队列 而 使 用 栈 是 个 坏 主意 ， 通 过 给 出 一 个 序列 导致 每 次 操作 人 花 
费 Q(N) 来 加 以 说 明 。 这 就 是 从 左 到 右 单 趟 合并 。 

12.36 不 用 DecreaseKey 我 们 可 以 除去 父 指针 。 使 用 和 斜 堆 结果 会 如 何 ? 








Q 参考 文献 


自 顶 向 下 伸展 树 在 原始 伸展 树 论文 [27] 中 作 了 描述 。 类 似 的 但 不 用 旋转 的 方法 在 文献 [29] 
中 描述 。 自 顶 向 下 红 黑 树 算法 取 自 文献 [16]， 更 易于 理解 的 描述 可 见于 文献 [26]。 自 顶 向 
下 红 黑 树 不 用 标记 节点 的 实现 在 文献 [14] 给 出 ， 它 提供 了 NullNode 实用 性 的 令 人 信服 的 
论证 。 确 定性 跳跃 表 及 其 变种 在 文献 [22，25] 中 讨论 。 对 称 二 又 B 树 来 源 于 文献 [6]， 课 文 
中 讨论 的 AA 树 的 实现 采用 文献 [1，3] 中 的 描述 。treap 树 中 是 基于 文献 [30] 中 描述 的 笛 卡 
儿 树 (Cartesian tree)。 相 关 的 数据 结构 是 优先 查找 树 (priority search tree)?! 。 

k-d 树 首 先 在 文献 [7] 中 介绍 。 其 他 的 范围 查找 算法 在 文献 [8] 中 描述 。 在 平衡 k-d 树 上 范 
围 查找 的 最 坏 情 形 在 文献 [18] 中 得 到 ， 而 课文 中 引用 的 平均 情形 结果 来 自 文 献 L[13，10]。 

配对 堆 及 在 练习 中 提出 的 变种 在 文献 [15] 中 描述 。 论 文 [17] 提 出 伸展 树 是 在 不 需要 
DecreaseKey 操作 时 选择 的 优先 队列 。 另 外 一 篇 论文 [28] 提 出 配对 堆 达 到 与 斐 波 那 契 堆 相 
同 的 渐 近 界 但 在 实践 中 性 能 更 好 。 然 而 ， 一 篇 使 用 优先 队列 实现 最 小 生成 树 算 法 的 相关 论 
文 [21] 提 出 Decreasekey 的 摊 还 时 间 不 是 0(1)。 

大 部 分 练习 的 解 可 以 在 原始 参考 文献 中 找到 。 练 习 12. 21 代表 多 少 有 些 流 行 的 一 种 
“懒惰 ”平衡 方法 。 文 献 [5，9，11，19] 描 述 一 些 特殊 的 方法 ; 文献 [2] 指 出 在 一 种 框架 内 
如 何 实现 所 有 这 些 方 法 。 满 足 练习 12. 21 中 的 性 质 的 树 是 加 权 平 衡 (weight-balanced) 的 。 
这 些 树 也 可 通过 旋转 保持 其 特性 5] 。 练 习 12. 21d 取 自 文献 [24]。 练 习 12. 26 到 12. 28 的 解 
可 以 在 文献 [12] 中 找到 。 


1. A. Andersson, “A Note on Searching a Binary Search Tree,” Software—Practice and 
Experience, 21 (1991), 1125-1128. 

2. A. Andersson, “General Balanced Trees,” Journal of Algorithms, to appear. 

3. A. Andersson, “Balanced Search Trees Made Simple,” Proceedings on the Third Workshop 
on Algorithms and Data Structures (1993), 61-71. 

4. C. Aragon and R. Seidel, “Randomized Search Trees,” Proceedings of the Thirtieth 
Annual Symposium on Foundations of Computer Science (1989), 540-545. 

5. J. L. Baer and B. Schwab, “A Comparison of Tree-Balancing Algorithms,” Communica- 
tions of the ACM, 20 (1977), 322-330. 




















496 


497 


390 


30. 


. R. Bayer, “Symmetric Binary B-Trees: Data Structure and Maintenance Algorithms,” 
Acta Informatica, 1 (1972), 290-306. 

. J. L. Bentley, *Multidimensional Binary Search Trees Used for Associative Searching," 
Communications of the ACM, 18 (1975), 509-517. 

. J. L. Bentley and J. H. Friedman, *Data Structures for Range Searching," Computing 
Surveys, 11 (1979), 397-409. 

. H. Chang and S. S. Iyengar, “Efficient Algorithms to Globally Balance a Binary Search 
Tree,” Communications of the ACM, 27 (1984), 695-702. 

. P. Chanzy, “Range Search and Nearest Neighbor Search," Master's Thesis, McGill 
University (1993). 

. A. C. Day, “Balancing a Binary Tree," Computer Journal, 19 (1976), 360-361. 

. Y. Ding and M. A. Weiss, *The k-d Heap: An Efficient Multi-Dimensional Priority 
Queue,” Proceedings of the Third Workshop on Algorithms and Data Structures (1993), 
302-313. 

. P. Flajolet and C. Puech, “Partial Match Retrieval of Multidimensional Data,” Journal 
of the ACM, 33 (1986), 371-407. 

. B. Flamig, Practical Data Structures in C++, John Wiley, New York (1994). 

. M. L Fredman, R. Sedgewick, D. D. Sleator, and R. E. Tarjan, *The Pairing Heap: A 
New Form of Self-Adjusting Heap,” Algorithmica, 1 (1986), 111-129. 

. L. J. Guibas and R. Sedgewick, *A Dichromatic Framework for Balanced Trees," 
Proceedings of the Nineteenth Annual Symposium on Foundations of Computer Science 
(1978), 8-21. 

. D. W. Jones, *An Empirical Comparison of Priority-Queue and Event-Set Implementa- 
tions," Communications of the ACM, 29 (1986), 300-311. 

. D. T. Lee and C. K. Wong, “Worst-Case Analysis for Region and Partial Region Searches 
in Multidimensional Binary Search Trees and Balanced Quad Trees," Acta Informatica, 
9 (1977), 23-29. 


. W. A. Martin and D. N. Ness, “Optimizing Binary Trees Grown with a Sorting 


Algorithm," Communications of the ACM, 15 (1972), 88-93. 


. E. McCreight, *Priority Search Trees," SIAM Journal of Computing, 14 (1985), 257-276. 


. B. M. E. Moret and H. D. Shapiro, *An Empirical Analysis of Algorithms for Constructing 
a Minimum Spanning Tree,” Proceedings of the Second Workshop on Algorithms and 
Data Structures, (1991), 400-411. 


. J. I. Munro, T. Papadakis, and R. Sedgewick, “Deterministic Skip Lists," Proceedings of 


the Third Annual Symposium of Discrete Algorithms (1992), 367-375. 


. J. Nievergelt and E. M. Reingold, “Binary Search Trees of Bounded Balance,” SIAM 


Journal on Computing, 2 (1973), 33-43. 

. M.H. Overmars and J. van Leeuwen, “Dynamic Multidimensional Data Structures Based 
on Quad and K-D Trees,” Acta Informatica, 17 (1982), 267-285. 

. T. Papadakis, Skip Lists and Probabilistic Analysis of Algorithms, Ph.D. Dissertation, 
University of Waterloo (1993). 

. R. Sedgewick, Algorithms in C, Addison-Wesley, Reading, Mass. (1990 ). 

. D. D. Sleator and R. E. Tarjan, “Self Adjusting Binary Search Trees,” Journal of the 
ACM, 32 (1985), 652-686. 

. J. T. Stasko and J. S. Vitter, “Pairing Heaps: Experiments and Analysis," Communications 
of the ACM, 30 (1987), 234-249. 

. C. J. Stephenson, “A Method for Constructing Binary Search Trees by Making Insertions 
at the Root,” International Journal of Computer and Information Science, 9 (1980), 

15-29. 

J. Vuillemin, “A Unifying Look at Data Structures,” Communications of the ACM, 23 

(1980), 229-239. 


索引 


索引 中 的 页 码 为 英文 原版 书 的 页 码 ， 与 书 中 页 边 标注 的 页 码 一 致 。 


A randomized algorithms( 随 机 化 算法 )，392-401 
aB pruning(a-B 裁减 )，411-413，414，423 Allen, B., 146 
AA-tree( AA W), 476-482 Amortized analysis JE 4} $f). 123-132. 273-279. 427-449 
Alramsonu. B. 44 binomial queue( 二 项 队列 ) ，428-433 
Abstract Data Type(ADT. 抽象 数据 类 型 ) disjoint set algorithm( 不 相交 集 算 法 ) 273-279 
defined( X); 41-42 Fibonacci heap( 3E UE AB HE), 435-445 
disjoint set( 不 相交 集合 ) 263-280 lazy binomial queue( 懒 惰 二 项 队列 ) 436 
hash table( 散 列表 ) ，149-172 potential function( fiz S PRO .. 428-433 
list( 表 ) 42-62 skew heap( 斜 堆 ) 433-435 
polynomial( 多 项 式 ) 52-54 splay tree( 伸 展 树 ) 445-449 
queue( 队 列 ) 79-84 Andersson. A.. 498 
stack(#8), 62-79 Approximation algorithm (E WAH). 
Ackermann function( Ackermann pA). 273 bin packing 4 £f [8] Bl), 337, 357-365 
Activation record(stack frame) Cif 3) ic ae CERDO. 77 traveling salesman problem( 旅 行 售货员 问题 )，335-336 
Acyclic graph( 无 圈 图 ) 284, 286-290, 305-308, 314 Aragon, C. , 498 
Adelson-Velskii, G. M. , 146 Array implementation 3X 4H 9: SL) , 
Adjacency list( 484 #8), 285-286 of lists), 43 
Adjacency matrix( 邻 接 和 矩阵 ) 284 of queues( PAS), 79-84 
Aggarwal, A., 424 of stacks(#¥). 66-71 
Aho, A. V., 40, 146, 282, 344 Articulation point %4), 322-326 
Ahuja, R. K. , 344 Atkinson, M. D. , 217 
Albertson, MO; + 13 auf der Heide, F. Meyer, 176 
Algorithm analysis( 算 法 分 析 ) ,. 15-35 AVL treeCAVL Bj). 110-123, 453, 495 
amortized analysis BER 4) Ht). 273-279. 427-449 deletion AN PR)» 121 
average-case analysis( FL) fJ 4) #7). 107-110, 244-245 double rotation( A jie fé£) , 112, 115-123 
basic rules FEA EMM). 18-20 insertion(#f A). 111, 116, 117, 118, 120 
empirical confirmation( 经 验证 实 ) 33-34 properties( 性 质 ) 110-111 
log arithmic running times( 对 数 运 行 时 间 )，28-33 single rotation( 单 旋转 )，112-115，120 
lower bound proofs( 下 界 证 明 )，33-34，221-222，247-250 B 
recursive procedures ( i IH it #2), 24-28. 232-235, B-tree(B BÍ). 133-138, 168-169 
241-245. 366-368 B* -tree(B* ff), 144 
Algorithm design( 算 法 设计 ) Backtracking algorithms [8] i8] 45:22) .. 401-413 
approximation algorithms( 近 似 算法 ) . 334-335, 336, 357-365 games(f4#3=). 407-413 
backtracking algorithms( [=] HAE). 401-413 a-B pruning(a-B Mw). 411-413, 414, 423 
divide-and-conquer strategy( 4} i$ HM). 26. 29, 231, minimax algorithm( 极 小 极 大 算法 ) 407-411 
365-380 principles of( 原 理 ) 401 
dynamic programming( 动 态 规划 )，380-392 turnpike reconstruction( 收 费 公 路 重建 ) 403-407 


greedy algorithms( 贪 焚 算 法 ) 174, 296, 347-365 Baeza-Yates, R. A. 147, 176, 261 


Balance condition(-¥ fp A{#). 109 

Banachowski, L., 282 

Baseball card collector problem (棒球 卡片 收集 者 问题 )， 

342-343 

Bavel, Z.. 13 

Bayer, R. , 147, 498 

Bell, T. , 176, 424 

Bellman, R. E. , 344, 424 

Bentley, J. L. , 40, 147, 261, 424, 498 

Biconnectivity XL iE iH PE), 322-326 

Big-Oh notationCK O 记号 ) 15-18, 21 

Big-Omega notation(K Q 记号 ) 15-18 

Bin packing C& ff [a] D) , 210, 337, 357-365 
best fit( 最 佳 适 合 ) 362 
best fit decreasing( 最 佳 适 合 递减 ) 362 
first fit( 首 次 适合 ) 360-361 
first fit decreasing( 首 次 适合 递减 ) 362 
lower bound for on-line algorithms( 联 机 算法 的 下 界 )， 

358-359 

next fit( 下 项 适合 ) 359-360 

Binary heap( Z X H), 179-189 
DeleteMin operation( 删 除 最 小 元 操作 ) 183-186, 187 
heap order( 堆 序 ) 180-182 
insertion(Jfi A), 182-183 
miscellaneous operations iR Ze4 ME), 186-189 
structure( #4 #8), 179-180 

Binary search( 折 半 查 找 ) 29-30 

Binary search tree( 二 叉 查 找 树 ) 89. 100-139 
average running time( 平 均 运 行 时 间 )，107-110 
basic operations( 基 本 操作 ) ，100-107 
deletion( 删 除 ) 105-107 
vs. hash table( 散 列表 ) 171-172 
k-d tree(k-d 树 )，146，485-488，494，496，497 

参见 Search tree 

optimal At fü). 387-390 

Binary tree(— X f). 95-100 
Huffman code( Huffman 编码 ) 351-357 

Binomial queue( Jj fA 9) .. 202-209 
amortized analysis of (HEIR 4} #7), 428-433 
DeleteMin operation( 删 除 最 小 元 操作 )，205，209 
implementation of( 实 现 ) 205-209 
insertion( 择 人 )，205-209 
lazy merging (fit 4 JE). 436, 439-442 
merging(£rJf). 204-205, 207, 209, 429 
miscellaneous operations jf Ze ## VE), 209 
structure( 构 造 ) 202-203 

Binomial tree( 二 项 树 ) 203. 207. 428-429 

Bipartite graph( 二 分 图 )，339 

Bitner, J. R., 147 


Bloom, G. S. . 424 

Blum, M. . 424 

Blum, N. , 282 

Bollobás. B.. 282 

Borodin, A.. 424 

Boruvka, O. , 344 

Boyer, R. S. , 175 

Breadth-first search( 广 度 优 先 搜 索 ) 291-295 
Bright. J.D. , 217 

Brodal, G. S. , 217 

Brown, D.J., 426 

Brown, M. R. . 216, 217, 451 
Brualdi, R. A. , 13 

Bucket sort( 桶 式 排序 ) 54-55, 250 


C 
Carlsson, S., 217 
Carmichael numbers( Carmichael 数 ) ，400 
Carter, J.L. , 175 
Cartesian treeCff FJL), 497 
Catalan numbers(Catalan 数 ) 385 
Chang, H., 498 
Chang. L., 424 
Chang, S.G.. 217 
Chanzy, P., 498 
Chen, Jes 217 
Cheriton, D. , 217, 344 
Chess( 国 际 象棋 ) 407 
Christofides, N. , 424 
Cleary, J. G. , 424 
Clique( Hl). 337, 342 
Closest points( 最 近 点 ) 368-373, 419-420 
Clustering RÆ), 157-165 
primary( 一 次 聚集 )，158 
secondary( 二 次 聚集 )，163 
Coin changing problemCfi i 4 FER), 296, 348. 421 
Collision resolution ( n 22 iB BR), 157-164 
ColoringC 2$ f&). 337 
Comer, D. , 147 
Compression C FE 44), 351-357 
Computational geometry( 计 算 几 何 ) , 364, 366-368. 403- 
407，421 
closest points( 最 近 点 ) 368-373, 419 
convex hull( 441), 420 
k-d tree(k-d BI). 146, 485-488. 494, 496, 497 
turnpike reconstruction( 收 费 公 路 重建 问题 ) 403-407 
Voronoi diagram( Voronoi 图 ) 419-420 
Connectivity (44 ii HE), 263-264, 322-326 
Convex hull(f4 J), 420 


Cook, S. . 344 

Cook's theorem(Cook 定理 ) 337 

Coppersmith, D. , 424 

Crane, C.A., 216, 217 

Critical path analysis (ifi 4B 1$ 4} Br). 305-308 

Cryptography% W), 35. 399-400 

Culberson, J.. 146, 147 

Culik, K. , 147 

Cursor implementation (Jf fj S: HD . 57-62 

D 

d-heap(d-}E), 192-193, 338, 436 

Day, A.C. , 498 

Deap( XX 3 HE). 217 

Decision tree( 决 策 树 ) 247-250 

Demers, A. 425 

Dense graph Hi % KI), 284-285 

Deo, N., 344 

Depth-first search I J£ ft ARR), 319-332 
directed graph Cfi [nj KI), 329-331 
undirected graph(¢ [a] KI), 320-322 

Deque( XX [A 9), 88, 451 

Deterministic skip lists( 确 定性 跳跃 表 )，469-476 

Dietzfelbinger, M. , 176 

Digraphs( 4 [6] RI). 283 

Dijkstra, E.W., 14, 344 

Dijkstra’ s algorithm ( Dijkstra @ iX 2). 295-303, 315. 

435-436 
Diminishing increment sort( 递 减 增 量 排序 ) 222 
参见 Shell sort 

Ding, Y., 217, 498 

Dinic, E. A. , 344 

Directed Acyclic Graph(DAG， 有 向 无 圈 图 )，284 

Directed graph% [a] Al), 283, 329-331 

Disjoint sets (RHIZ), 35, 263-280, 316-319 
analysis( 4} $f), 273-279 
deunion operation df 8j FF WEE LE). 280 
dynamic equivalence problem( 2 AS ^$ Hf |n] BE). 264-265 
equivalence relations( A5 ffr K A). 263-264 
Kruskals algorithm( Kruskal 算法 ) 316-319 
quick find algorithms Cft s ARF), 264-265 
quick union algorithms Tti cK IF WHE). 265-279 
implementation of basic algorithm( 基 本 算法 的 实现 ) , 
265-269 
path compression( 路 径 压 缩 ) 271-273, 279 
path halving( 路 径 折 半 )，281 
union heuristics( 求 并 试探 法 ) 273-279 

Divide and conquer( 分 治 算法 ) 365-380 
analysis of general case( 一 般 情 形 分 析 ) 366-368 


索 引 393 


closest points( 最 近 点 ) 368-373 
integers, multiplication of( 整 数 ， 乘 法 ) 376-378 
matrix multiplication( 和 矩阵 乘法 ) 378-380 
maximum subsequence sum( 最 大 子 序 列 和 )，19，24-28 
mergesort( 归 并 排序 ) 230-235 
principles of( 原 理 ) 365-366 
quicksort (HEF), 235-247 
selection( 选 择 ) 373-376 
Double-ended queue( 双 端 队列 ) 
Doyle, J. , 282 
Dreyfus, S. E. , 424 
Driscoll, J: R. » 217 
Du, HC e 176 
Due, M. W. , 217 
Dynamic equivalence problem( ah AS 4 fff la] Bi) , 264-265 
Dynamic programming (JA FMRI), 380-392 
all-pairs shortest path( 所 有 点 对 最 短路 径 ) 390-392 
chained matrix multiplication( 链 接 和 矩阵 乘法 ) 383-386 
optimal binary search tree( 最 优 二 叉 查 找 树 ) 387-390 
principles of (J FB) , 380-383 
E 
Edelsbrunner, H. , 424 
Edmonds, J. , 344 
Eight queens problem(/\ ¥ Ja [8] Bi), 421-422 
Eisenbath, B., 147 
Enbody, R.J.. 176 
Eppinger, J. L., 146, 147 
Eppstein, D. , 424 
Equivalence class( ^5 ffr2&), 264-265 
Equivalence problem (4 ffr |n] Bi). 264-265 
Equivalence relations( 4 ff KK), 263-264 
Eriksson, P., 218 
Euclid's algorithm( 欧 几 里 得 算法 ) 31-32 
Euler circuit( 欧 拉 回 路 ) 326-329. 333, 341 
Euler's constant( 欧 拉 常 数 ) 5 
Even, S., 344 
Event simulation $44 234), 84, 191-192 
Exponentiation #£iz $$). 32-33 
Exponents, formulas for(48 t. ZA), 3 
Expression tree IKA), 97-100 
Extendible hashing( 可 扩散 列 ) 168-171 
performance of( 性 能 ) 171 
External sorting( 外 部 排序 ) 250-256, 260 
multiway merge( 多 路 归并 ) 253 
polyphase merge( 多 相 归 并 )，254 
replacement selection( 替 换 选 择 ) 255-256 
run construction( 顺 串 构造 )，252-253，255-256 
simple merging( 简 单 合 并 )，252-253 


394 数据 结构 与 算法 分 析 C 语言 描述 


F complete( 完 全 图 ) 284 
Fagin, R., 176 cycle( R), 283-284 
Fermat's lesser theorem ( $4 /|vzg 3) .. 400 negative cost cycle( 负 值 圈 ) 290 
Fibonacci heap( 斐 波 那 契 堆 ) 435-445 definitions(# X.) , 283-284 
amortized analysis of( 摊 还 分 析 ) .. 440-442 dense( $i] S; Fl), 284-285 
basic operations JEZk RE), 442-443 depth-first search T HE [ft c4 R), 319-332 
cascading cut( 级 联 切除 ) 442 directed, 277, 329-331 
Dijkstra’s algorithm( Dijkstra 算法 ) 303 Euler circuit( 欧 拉 回 路 )，326-329 
marking nodes( 标 记 节 点 )，436-439 Hamiltonian cycleCH 4E /K Wii PA). 329, 330, 334-337 
Fibonacci number CAE EJ HH). 443 isomorphism ( [E] #4), 144 
bad use of recursion (3 IH AY RH f HD. 23. 281 longest path( 最 长 路 径 ) 334, 337 
Ath order(k 阶 斐 波 那 契 数 )，255 matching( 匹 配 ) ，339 
polyphase merge( 多 相合 并 ) ，254 minimum spanning tree( 最 小 生成 树 ) ，313-319 
properties of( 性 质 ) 6. 12. 443 multigraph( 多 重 图 )，341 
File compression( 文 件 压缩 )，351-357 planar( 平 面 图 )，341 
File system( 文 件 系统 )，79-84 representation( 图 的 表示 法 ) 284-286 
Fischer, M. J. ，282，426 shortest path( 最 短路 径 ) 290-308. 313. 390-392 
Flajolet, P. , 147, 176, 498 acyclic graph XAKI). 305-308 
Flamig, B. , 498 all-pairs( Brfj XT), 308, 390-392 
Floyd, R. W. , 217. 261, 426 negative edge costs( f W fÈ), 305 
Ford, L.R., 261, 343, $344 single source unweighted( #14 5 FEAL). 290-295 
Fredman, M. L., 176, 217, 282, 344, 424, 451, 498 single source weighted Ht Az si WRAL). 295-304, 435 
Friedman, J. H. . 147, 498 sparse( fp Hi 1), 285, 288, 302 
Fulkerson, D. R. , 343, 344 strong components $i i£ ii E] ) , 331-332 
Fuller, S. H. , 147 topolog ical sort 4 Fh HE FF). 286-290 
G traveling salesman hi fT i f$ fi), 335-336. 418 
Gabow. H.N. , 217, 282, 344 vertex cover it si WO, 342 
Gajewska, H., 451 Greedy algorithms( 9t 45 # YE), 347-365 
Gall, Z, y S44, ao approximate bin packing ( if [pL AE 48 [8] MD). 357-365 
Galler, B. A. 282 coin changing(fili ifj FRE), 348 
Game tree( 博 弈 树 ) 411-412 Huffman codes( Huffman 编码 )，351-357 
Garey, M.R., 344, 425 minimum spanning tree( 最 小 生成 树 ) 313-319 
GCD( 最 大 公 因 子 ) processor scheduling( 处 理 器 调度 ) 348-351 
Giancarlo; E; apa shortest path( 最 短路 径 ) 295-303 
Godbole, S. , 424 Gries, D. , 14 
Goldberg, A. V., 344 Growth rate: (增长 率 ) 
Golin, M., 261 exponential (4§ RAY), 24 
Gonnet, G. H. , 147, 176, 218, 261 of functions( ER EX fJ), 16-18 
Graham, R.L., 14, 425 Gudes, E. , 147 
Graph( l), 283-337 Guibas, L.J., 147, 176, 498 
activity-node( 活 动 节点 ) 299 Gupta, R. , 424 
acyclic( PARI), 284. 286-290, 314 H 
test for( Wik). 287, 331 Hagerup. T., 344 
biconnectivity XX E38 PE). 322-326 Haken, D. , 424 
bipartite( 二 分 图 ) 339 Halting problem( 停 机 问题 ) 333 
breadth-first search( 广 度 优先 搜索 ) 291-295 Hamiltonian cycle( 哈 密 尔 顿 图) 329, 331, 326 
clique( 团 ) 337, 342 Harary, F., 344 


colorabilityCnT 2$ (& HE), 337 Harries, R., 176 


Hash table( 散 列表 ) 
Hasham，A. 218 
Hashing( 散 列 ) 149-172 


binary search tree, compared to( 二 叉 查找 树 ， 比 较 )，172 


open addressing( 开 放 定 址 )，157-165 
analysis of( 分 析 ) 157-159 
clustering( 聚 集 )，157-164 
deletion HBR), 161 
collision resolution im E IÑ BR). 157-165 
double XX f 9l) ,. 164-165 
extendible( RT 4^ AF), 168-171 
hash function Cf Jl] PA BO,. 149, 150-152 
linear probing( 线 性 探测 ) 157-159 
load factor( 装 填 因 子 ) 157 
separate chaining( 分 离 链接 ) 152-157, 171 
quadratic probing( 二 次 探测 )，160-163 
random collision resolution( 随 机 冲突 消除 )，158 
rehashing( 再 散 列 ) 165-168, 450 
table size( 表 大 小 ) 149-150, 171-172, 399 
Heap( JE). £ WW Priority gueoue 
Heap order property (HE J TE .. 180-182 
Heap sort( 堆 排序 ) 190, 226-230, 256-257, 261 
Hibbard, T. H. . 146, 147, 261 
Hirschberg, D. S., 425 
Hoare, C. A.R. , 261, 262 
Hoey, D. , 426 
Hopcroft, J. E., 40, 146, 282, 344, 345 
Horner's rule( Horner 法 则 )，37 
Horvath, E. C. , 261 
Hu, T.C. , 424 
Huang, B., 262 
Huffman, D. A. , 425 
Huffman codes, 351-357 
Hutchinson, J. P., 13 


Incerpi. J. , 262 
Indirect sorting( 间 接 排 序 ) 247 
Infix expression( 中 级 表达 式 )，74 


Infix to postfix conversion( 中 缀 到 后 级 的 转化 )，74-77 


Inorder traversal( 中 序 遍 历 )，97-98，132 
Insertion sort( 插 入 排序 )，220-221 
analysis( 分 析 ) ，221 
implementation( 实 现 ) 220 
Integer, multiplication of( 整 数 ， 乘 法 ) 376-378 
Inversion( 逆 序 ) 221-222 
lyengar, S. S., 498 


Johnson. D. B. . 218, 345 


Se 


Johnson, D. S. . 344, 425 

Johnson. S. M. , 261 

Jonassen, A. T. . 147 

Jones, D. W. , 498 

Josephus problem(Josephus 问题 ) 86, 145 


K 
K-d heap(k-d H), 496 
K-d tree(& 维 树 ) 145-146, 485-488 
Kaas, R., 218 
Kaehler, E. B. , 147 
Kahn. A.B.. 345 
Karatsuba, A. , 425 
Karger, D. R. . 345, 425 
Karlin, A. R. . 176 
Karlton, P.L. . 147 
Karp, R. M. 176, 282, 344, 345 
Karzanov, A. V., 345 
Kernighan, B. W., 14, 345 
Khoong, C. M. . 218, 451 
King, V.. 345 
Klein, P. N., 345 
Knapsack problemC?$ &[n] i), 337, 421 
Knights tour( 骑 士 ( 马 ) 游 历 ) 422 
Knuth, D.E., 14, 40. 147, 176, 216, 218, 
262, 282, 345, 425 
Komlos, J.. 176 
Korsh, J. , 424 
Kruskal, J. B. Jr... 345 
Kruskals algorithm( Kruskal #7), 316-319 
参见 Greedy algorithm 
Kuhn, H. W. 345 


Landau. G. M. . 425 
Landis, E. M. . 146 
Langston, M. , 262 
LaPoutre, J. A. , 282 
Larmore, L. L. , 425 
Lawler, E.L. , 345 
Lazy binomial queue( 懒 惰 二 项 队列 ) 439-442 
Lazy deletion ff ff HH BRD 
AVL tree(AVL 树 ) 121 
binary search tree( — X Zt RAY), 105-107 
closed hash table( 闭 散 列 表 ) 157 
leftist heap( 左 式 堆 )，213 
linked list( 链 表 ) 78 
Lazy merging (Witi AJ). 436, 439-442 
Lee, C.C., 426 
Lee, D. T. , 426, 498 


261, 


395 


396 


CHF 


数据 结构 与 算法 分 析 jb du 


Lee, K. , 425 
Leftist heap( AE stHE), 193-200, 436-439 
cutting nodes 5] BR 15 #8), 436-439 
DeleteMin operation( 删 除 最 小 元 操作 ) 197, 198 
implementation of( 实 现 ) 193-194 
insertion( 插 入 )，198 
merging( 合 并 )，194-196 
structure( 构 造 ) 193 
Lehmer, D. , 395 
Lelewer, D. A. , 425 
Lemke, P., 426 
Lempel, A. , 426 
Leong, H. W., 218, 451 
Level-order traversal Jz 3i Jj), 133 
Lewis, T.G. , 176 
Liang, F. M. , 425 
Lin, Si, 345 
Line printer queue( 行 式 打 印 机 队列 ) 84 
Linear congruential generator( 线 性 同 余 发 生 器 ) ，394-397 
Linear probing( 线 性 探测 ) 157-159 
Linked list( 链 表 ) 43-62, 205, 397-399 
adjacency( 邻 接 ) 285 
circularly linked list( 循 环 链表 ) 52 
common errors( 普 通 错 误 ) 49-51 
cursor implementation( 游 标 实现 ) 57-62 
doubly linked list( 双 链表 )，51 
header cell( 头 单元 ) 45-49 
implementation of( 实 现 ) ，52-57 
multilist( 多 重 表 ) 56-57 
for polynomial arithmetic( 多 项 式 运算 使 用 的 链表 ) 52-54 
skip list BERK), 397-399 
stack, implementation of f£. SCH), 63-71 
Lists) : 
array implementation 444 ZI), 43 
参见 Linked list 
Load factor (si Af), 157 
Logarithms( Xf &) : 
formulas for( 对 数 的 公式 ) 3-4 
in running time( 运 行 时 间 )，28-33 
Longest common subsequence problem( 最 长 公共 子 序列 问 
题 )，421 
Longest increasing subsequence problem( 最 长 递增 子 序列 
问题 ) 420 
Lower bound: (下 界 ) 
information theoretic( 信 息 理论 ) 250 
on-line bin packing( 联 机 装 箱 问题 )，358-359 
proof( 证 明 )，222，247-250 
sorting( 排 序 )，221-222，247-250 
Lueker, G., 176 


M 
Mahajan, S, 425 
Majority problem( 主 要 元 问题 ) 38-39 
Manacher, G. K. 262 
Margalit, O. , 424 
Martin, W. A. , 498 
Matrix multiplication; (矩阵 乘法 ) 
chained( 链 接 的 矩阵 乘法 ) 383-386 
Strassen's algorithm(Strassen 算法 ) 378-380 
Maurer, W.D., 176 
Maximum subsequence sum problem( 最 大 子 序 列 和 问题 )， 
19, 24-28, 39 
McCreight, E. M. . 147, 498 
McDiarmid, C.J. H. , 218 
McElroy, M.D. , 261 
McKenzie, B.J., 176 
Median of three partitioning( = #4 fli) MIZE). 237, 247 
Melhorn, K., 147, 176, 344, 345 
Merge/find algorithm( 合 并 /查找 算法 ) 
参见 Disjoint set 
Mergesort( 归 并 排序 ) 230-235 
analysis( 分 析 ) 232-235 
implementation XZ), 231-232 
merging(£rJf), 230-235 
Merging: (合并 ) 
binomial queues( 二 项 队列 )，204-205，209，428-433 
lazy fif). 436, 439-442 
multiway( 多 路 合并 ) 253 
polyphase( 多 相合 并 ) 254 
skew heapsC ALME). 433 
Miller, G. L. , 425 
Miller. K. W. , 425 
Minimax algorithm( 极 小 极 大 算法 ) 407-411 
Minimum spanning tree( 最 小 生成 树 ) 313-319. 418 
Modular arithmetic ( 模 运 算 )，5，161-163，400-401， 
402，403-404 
Modularity( 模 块 化 ) 41 
Moffat, A. , 452 
Molodowitch, M. , 176 
Monier, L., 425 
Moore, J.S., 175 
Moore, R.N. 425 
Moret, B. M. E. , 345, 494 
Morris, J. H. , 176 
Morris, R., 176 
Motwani, R., 425 
Multigraph( 4 EKI), 342 
Multilists( & Wf d). 56-57 


Multiway merge( 多 路 合并 ) 253 
Munro, J.I.. 146, 218, 424, 498 
N 
Negative cost cycles( fit fft 81) 284 
Ness. D. N. . 498 
Network flow( kJ 4% ili). 308-313 
Next fit( 下 项 适合 ) 359-360 
Nievergelt, J.. 147, 498 
Nondeterminism( 4 Sf zz E). 334 
Nonpreemptive scheduling(4E fi ri #4 AE), 348-351 
NP problem(NP 问题 ) 334-335 
NP-completeness( NP-5& 4 E). 333-337, 343 


O 
Odlyzko, A.. 147 
Off-line algorithms Jii BL T1) . 264, 362-365 
Ofman; Y., 425 
One-dimensional circle packing problem ( — 4f $ [I [i] 
iB). 418 
On-line algorithm EX BL $14: ) 
bin packing CE fi [n] WH), 358-362 
disjoint sets algorithm A 4H 22 4E WIE). 263-279 
graph connectivity( 图 的 连通 性 ) 263-264 
maximum subsequence sum problem( 最 大 子 序 列 和 问 
题 )，19，24-28，39 
symbol balancing( 符 号 平衡 ) 71 
Optimal binary search tree( 最 优 二 又 查找 树 ) 387-390 
Orlin, J. B. . 344 
Ottman, T., 147 
Overmars, M. H. , 282, 499 


P 
Pairing heaps fic Xf HE). 488-494 
Pan, V., 425 
Papadakis, T. , 499 
Papadimitriou, C. H. . 345 
Papernov, A. A. 262 
Paragraphing problem( 4} Ez [n] ii). 420 
Park, S. K. , 425 
Parse tree Ai i, Pj», 138 
Patashnik, O. , 14 
Path compression P f$ FE 4i) .. 271-273 
Path halving( 路 径 平 分 )，281 
Pattern matching( 字 型 匹配 ) 174, 421 
Perlis, A.J. ，148 
Peterson, W. W., 176 
Pippenger, N. , 176 
Planar graph(¥ fii). 341 
Plauger. P. J. . 14 
Plaxton, C. G. , 262 


Poblete, P. V. , 217 
Polynomial ADT( 多 项 式 ADT), 52-54 
Polyphase merge( 多 相合 并 ) 254 
Pooren, B.. 262 
Port, G. , 452 
Positive-cost cycles (IE (HFA). 306 
Postfix expression JG ARIA). 72-77, 95 
evaluation of( 值 的 计算 )，74 
Postorder traversal( 后 序 遍 历 ) 93, 98, 133 
Potential( 位 势 )，428，431，449 
Pratt, V.R., 176, 262, 424 
Prefix code( 前 级 码 )，353 
Prefix form( 前 缀 形式 )，98 
Preorder traversal( 先 序 遍 历 ) ，93，98，132，319 
Preparata, F.P., 425 
Prim, R.C., 345 
Prims algorithm( Prim $35). 314-316 
参见 Greedy algorithm 
Primality test E PEW ik). 399-401 
Priority queue ( ft 46 BA 9i] ), 177-212, 302-303, 319, 
321, 357 
basic operations( 基 本 操作 ) . 182-186 
binary heap( 二 叉 堆 )，179-189 
binomial queue( — mi BAF). 202-209 
d-heap(d-HE) , 192-193 
deap( XX ig HE), 217 
Dijkstra's algorithm(Dijkstra 算法 ) 303, 435-436 
external sorting( 外 部 排序 ) 250-256 
Fibonacci heap( 斐 波 那 契 堆 )，435-445 
heapsort( 推 排序 ) 190, 226-230, 257 
Huffman code( Huffman 编码 )，357 
k-d heapCk-d HE), 496 
Kruskals algorithm( Kruskal 算法 ) 316-319 
leftist heap( A: 3X HE), 193-200, 436-439 
min-max heap( min-max HE), 214 
pairing heaps( fic Xf HE), 488-494 
Prims algorithm( Prim 135) .. 314-316 
simple implementations( 简 单 实现 ) 178-179 
simulation( 模 拟 ) 191-192 
skew heap( RHE), 200-202, 433-435 
Probing: (探测 ) 
linear( 线 性 )，157-159 
quadratic( 二 次 )，159-164 
Proofs: (证 明 ) 
by contradiction( 反 证 法 ), 7 
by counterexample( 4 Jz (iE HA), 7 
by induction( 数 学 归纳 法 ) 6-7, 10-11 
lower-bound( 下 界 ) 221-222, 247-250 
Pruning( 裁 减 )，401，411-413 


397 


398 


数据 结构 与 算法 分 析 C 语言 描述 


Puech, C. , 498 
Pugh, W. , 425 
‘ Q 
Quadratic probing GE Fy f l|). 159-164 
QueueC[A FIJ), 79-84, 177-178, 196 
array implementation of( 数 组 实现 ) 79-84 
basic operations( 基 本 操作 ) 79 
breadth-first search( 广 度 优 先 搜索 ) 293-295 
double-ended(deque)( 双 端 队列 ) 88, 451 
line printer( 行 式 打印 机 ) ，84 
topolog ical sort Fi Fp HEF). 286-290 
Queueing theory HEBA iE). 84 
Quickselect( 快 速 选择 ) 245. 273 
Quicksort( 快 速 排序 ) 235-247. 256. 258 
analysis( 分 析 ) 241-245 
basic algorithm( 基 本 算法 ) 235 
cutoff( 截 断 )forsmall files，240 
dealing with duplicates( 处 理 重复 元 )，238 
implementation( Hl), 240-241 
partitioning( XI 4). 237-240 
picking the pivot GE HX Zl IC), 237 
pitfalls Bei jet WY fl). 238-239 
R 
Rabin, M. O., 176, 426 
Radix sort( 基 数 排序 ) 54-56 
Raghavan, P. 425 
Ramanan, P. , 426 
Random number generator [i BLA Az ^: #8), 394-397 
Random permutation generator( 随 机 排列 发 生 器 ) 36-37 
Randomized algorithm( 随 机 化 算法 ) 392-401 
primality test( 素 性 测试 ) ，399-401 
principles of( 原 理 ) 392-394 
quicksort( 快 速 排序 ) 237 
selection( 选 择 ) ，375-376 
skip list( 跳 跃 表 ) 397-399 
Rank( 秩 (级 ， 层 ))，272，429，440 
Rao, S., 345 
Recurrence relations; (3$ K A) 
solution of(fff), 233-235, 241-242, 366-388 
Recursion; (EH) 
backtracking algorithm( [n] 8] 25:32) ,. 401-413 
bad uses of (AN “4 f A), 77-78. 381 
depth-first search T E [Jo F648 22) .. 319-332 
exponentiation Hi $E) .. 32-33 
four basic rules( 四 条 基本 法 则 )， 9, 11-12 
leftist heap ÆR HE), 193-200 
path compression (KIE), 271 
principles of CJ El) ,. 8-12 


printing out numbers( 打 印 出 数 ) 10 
recovering shortest path( 恢 复 最 短路 径 ) 306, 308 
selection( 选 择 ) ，245-246 
skew heap( 斜 堆 ) 200-202 
tail recursion( 尾 递归 ) 78 
trees( 树 ) 89-139 
参见 Divide and conquer 
Recursively undecidable problem (递归 不 可 判定 问题 )， 
333-334 
Red-black trees( 红 黑 树 ) 146, 457-469 
bottom-up insertion( 从 底 向 上 插入 )，462-463 
properties( 性 质 )，457，462 
top-down deletion( 自 顶 向 下 删除 )。465-468 
top-down insertion( 自 顶 向 下 插入 )，454-456 
Reduction( 归 约 )，335-337 
Reed, B. A. 218 
Reflexive relation( 2 8] X: &). 263 
Rehashing( 再 散 列 ) 165-168, 450 
Reingold，E. M. 147, 498 
Relation( 关 系 )，263 
Replacement selection( 替 换 选 择 )，255-256 
Reverse Polish notation 3X gi ?^* jt ik). 72 
Rivest, R. L. , 282, 424 
Roberts, F.S., 14 
Rotation; (旋转 ) 
double( 双 旋转 )，115-128 
single( 单 旋转 )，112-115 
Run construction( 顺 串 构 造 ) 252-253, 255-256 
Running time; (运行 时 间 ) 
calculations( 计 算 ) 20-34 
checking analysis of (验证 分 析 ) 33 
of divide-and-conquer algorithms( 分 治 算法 ) 366-368 
examples of( 例 )，18-19，21 
general rules( 一 般 法 则 )，21-23 
growth rates of( 增 长 率 )，19 
as an issue in large inputs( 作 为 大 型 输入 中 的 问题 )，2， 
17-18 
log arithms in( Xf %0 , 28-32 
over-estimates of( 过 高 估计 )，33-34 
solutions for maximum subsequence sum problem( 最 大 
子 序列 和 问题 的 解 )，24-28 
S 
Sack, J.R. , 217, 218 
Saks, M. E. , 282 
Santoro, N., 217 
Saxe, J.B. , 424 
Schaffer, R. , 262 
Scheduler, operating system Hi HE FRJE .. FRYE AE). 177 


Scheduling ( #4 JE), 348-351 
Schonhage. A. , 282 
Schrage. L.. 426 
Schwab, B.. 498 
Scroggs. R. E., 147 
Search tree: (查找 树 ) 
AA-trees( AA 树 ) 476-482 
AVL treeCAVL ff), 110-123, 453 
k-d trees(k-d Bj). 145, 485-488, 494, 496, 497 
red black trees( 红 黑 树 ) 146, 457-469 
splay trees( 伸 展 树 ) 123-132. 445-449, 453-461 
treaps(treap 树 ) 482-485 
Selection problem: (选择 问题 ) 
in a binary search tree( 二 叉 查 找 树 ) 145-146 
in linear worst-case time( 线 性 最 坏 情 形 时 间 )，373-375 
inefficient algorithms for( 有 效 算 法 ) 2 
priority queue solution( 优 先 队 列 解 ) 190-191 
quickselect( 快 速 选 择 ) 245 
sampling algorithm( 样 本 算法 ) 375-376 
Self-adjusting data structure; ( 自 调整 数据 结构 ) 
disjoint sets algorithm( 不 相交 集 算 法 ) 268-279 
list( #2). 85, 451 
skew heap( RH), 200-202. 433-435 
splay tree( 伸 展 树 ) 123-132, 445-449 
Sentinel( 标 记 )，183，220 
Series( 级 数 ) 4-5 
arithmetic( 算 术 级 数 ) 5 
geometric( 几何 级 数 )，4 
harmonic( 调 和 级 数 )，5 
sum of kth powerCk KEN A). 5 
Shamos, M. I., 425, 426 
Shapiro. H.D.. 345, 498 
Sharir, M. , 345 
Shell. D. L. , 262 
Shellsort AK HEFE). 35, 222-226, 256-257, 261 
analysis( 分 析 ) .. 224-226 
Hibbard's increments( Hibbard 增 量 ) 225-226 
Shell's increments( 希 尔 增 量 )，224-225 
average running time( 平 均 运行 时 间 )，225，257 
implementation( 实 现 ) 223 
Shing, M. R. . 424 
Short-circuit operation GE $E f$ HR [ED ，45 
Shortest-path algorithm( 最 短路 径 算 法 ) 294-308 
Shrairman, R., 217 
Sieve of ErastothenesCJE fii & IE Hifi). 38 
Simon, I., 282 
Simulation (iW). 84, 191-192 
Skew heap(# HE), 200-202, 433-435 
amortized analysis of (FER 4} Br) ,. 433-435 


Skiena, S.S., 426 
Skip list (BERR #). 397-399 
Sleator, D.D.. 148. 217, 218. 452, 499 
Smith, H.F., 148 
Smith, W.D., 426 
Smolka, S. A. , 424 
Sorting (HEF). 219-257 
algorithms, compared( i $31. HERE). 256-257 
bucket sort fist HERR), 54-55, 250 
comparison-based( 基 于 比较 的 ) 219 
external sorting( 外 部 排序 ) 250-256. 260 
heapsort( 扒 排序 ) 226-230. 257 
insertion sort(4fi A HEF). 220-221 
large records( Kid). 246 
lower bounds( F 45, 221-222, 
mergesort( 归 并 排序 ) 230-235 
duicksort( 快 速 排序 ) 235-247, 261 
Shellsort( 和 希 尔 排 序 ) 35, 222-226, 256-257, 261 
stable( faze J). 261 
topolog ical( 拓 扑 排序 ) 286-290 
tree sort( 树 排序 ) ，139 
Sparse graph Mr. 285. 288. 303 
Spelling checker( 拼 写 检查 程序 ) 172 
Spencer. T. H. 344 
Splay tree( {HE Bj). 123-132, 445-449, 453-461 
amortized analysis of( 挫 还 分 析 )，445-449 
analysis of( 分 析 ) 131-132 
deletion( 删 除 ) 129 
merging( 合 并 )，442 
self-adjustment( 自 调整 )，123-132 
splay steps: implementation of( 展 开 步 又: 实现 )，127-132 
top-down implementation( 自 顶 向 下 实现 )，453-461 
zig( 单 旋转 )，445，446，447 
zig-zag( 之 字形 旋转 ) 126-127, 445, 446, 447-448 
zig-zig( 一 字形 旋转 ) 126-127, 445, 448-449 
Stack( 栈 ) 62-79, 288 
array implementation( 数 组 实现 ) 66-71 
balancing parenthesis( 平 衡 圆 括号 ) 71 
fundamental operations( 基 本 操作 ) ，62-63 
list implementation( #2 Hl), 63-66 
and recursion( Aili), 76-77 
topolog ical sort iF} HEF). 288 
Stack frame( F& Ii). 77 
Stasevich, G. V. , 262 
Stasko, J. T. , 499 
Steiglitz. K. . 345 
Stephenson, C.J. . 499 
Stirlings formula( Stirling 公式 ) 259 
Strassen, V. 426 


247-250 


399 


数据 结构 与 算法 分 析 C 语言 描述 


Strassen's algorithm(Strassen 算法 ) 378-380 2-3 tree(2-3 树 ) 134-138, 451 
Strong components( 强 分 支 ) 331-332 weight-balanced( 赋 权 平 衡 树 ) 146 
Strong, H. R. ，176 TrieCTrie 树 ) 352-357 
Strothotte, T. , 217, 218 Tsur, S. . 147 
Successor position( ri 4k 7c [V Hi). 408 Tucker, A.. 14 
Suel, T. , 262 Turing machine( RIR HL). 337 
Symbol table(ff 5 #), 171 Turnpike reconstruction (Xx 2 ZS Pi EŒ), 403-407 
Symmetric binary B-tree( Xt f — X. B |j) 2-d tree(2-d BID. 145 

参见 AA-tree 2-3 tree(2-3 fH), 134-138, 451 
Symmetric relation XE f& X A), 263 U 
Szemeredi, E. , 176 Ullman, J. D., 40, 146. 282, 344, 452 

iL Undecidability( 不 可 判定 性 )，333 

Tail recursion( 尾 递归 )，78 Undirected graph( 无 向 图 ) 321-323 
Takaoka, T. , 426 Union/find algorithm( 合 并 /查找 算法 ) 35. 263, 316 
Tardos, E. , 344 V 
Tarjan, R.E., 1, 471, 762, 172. 823, 440 vn S. Eig 
Telescoping Æi), 234 VanEmdeBoas, P., 218 
Theta notation( 9 符号 ) 15 VanKreveld, M.J., 282 
Thornton, C. , 148 VanLeeuwen, J., 282, 499 
Threaded tree( 线 索 树 ) 145 VanVleit, A.., 426 
Thurston, W. P. , 148 Vertex cover problem( 顶 点 覆盖 问题 ) 342 
Tic-tacr-toe( 三 连 游戏 棋 )，407，410 WE 
Trasitive relation( 传 递 关 系 ) 263 Vitter, J. S., 499 
Transposition table 4E K). 172, 411 Voronoi diagram( Voronoi K|), 419-420 
Traveling salesman iK íT #8 ft 54). 335-336 Vuillemin, J., 218, 452, 499 
Treaps(treap 树 ) 482-485 Ww 


Tree(s) (ft), 89-146 
AACAA BD. 476-482 
AVL(AVL 树 ) 110-123, 427 
B-tree(B fj). 133-138, 168-169 
Bx -tree(B x $f), 144 
binary(— X f). 95-100, 351-357 
binary seach( 二 叉 查 找 树 ) 89. 100-139 
complete binary( 完 全 二 叉 树 ) 179 
decision( 决 策 树 ) ，247-250 
definitions( 定 义 )，89-90 
game( 博 弈 树 ) 410 
k-dCk-d BI). 144, 485-488 
leftchild/rightsibling implementation (7r JL F/A hi sf 3: 
WIE), 209 
minimum spanning( 最 小 生成 树 ) 313-319, 418 
red-black( 红 黑 树 ) 146, 457-469 


Wagner. R. A. 426 
Wagman. M. N.. 175 
Weight-balanced tree( 赋 权 平衡 树 ) 497-498 
Wein, J. ，424 
Weiss, M. A. , 14, 217, 262, 498 
Westbrook, J. , 282, 345 
Williams, J. W. J. . 218. 262 
Winograd, S. , 424 
Witten, I. H. , 424 
Wong, C. K. , 498 
Wong, J.K. , 345 
Wood, D.. 147 

Y 


Yaos A.C. 5 148, 170, 262. 282, 345 
Yao, FF. , 426 


splay tree Cf JERE), 123-132. 445-449, 453-461 Z 
threaded (RH). 145 Zhang, Z.. 426 
tavesals( id Jj) , 91-95, 132-133 Zijlstra, E. , 218 

trie( Trie f). 352-357 Ziv, J., 426 


2-d tree(2-d fH). 145 Ziviana, N. , 147 


